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Thema der Arbeit sind die multimodalen Aspekte der Verwendung von Mo- 
dalpartikeln (Abtönungspartikeln) im Deutschen. Dass die Modalpartikeln etwas 
Besonderes an sich haben, schrieb schon der Urvater der Partikelforschung, Ha- 
rald Weydt (2010: 13): 


Da Partikelforscher sich mit Sprachelementen beschäftigen, die nicht (wie die Wörter mit 
lexikalischer Bedeutung) die leicht zu verstehende Aufgabe haben, die außersprachliche 
Wirklichkeit zu zergliedern und deren Ausschnitte zu benennen, können sie sich schmei- 
cheln, über einen besonders sprachlichen und edlen Gegenstand zu reflektieren. 


Dass es sich bei den Modalpartikeln um einen „besonders sprachlichen und ed- 
len Gegenstand“ handelt, werde ich natürlich nicht leugnen. Allerdings möchte 
ich die Begründung noch etwas weiter führen, als es Harald Weydt getan hat. 
Tatsächlich haben Modalpartikeln keine rein proportionale oder referentielle Be- 
deutung, aber das an sich macht sie noch nicht so besonders, wie sie sind. Das 
Besondere liegt vielmehr darin, dass ihre Natur so schwer zu erfassen ist (was an 
sich zwar zum Teil auch mit der von Weydt angesprochenen nicht-referentiellen 
Bedeutung zu tun hat, aber nicht nur damit). Wie auch bei so manchem anderen 
Forschungsobjekt ist es bei den Partikeln so, dass jede neue Antwort mehrere 
weitere Fragen aufruft. Dies zeigt sich auch darin, dass nach fast 50 Jahren inten- 
siver Erforschung dieser Wortart noch viele Fragen unbeantwortet sind oder das 
Thema lebhafter Diskussionen bilden. Auch die vorliegende Arbeit dürfte wieder 
Anlass für weitere Diskussionen und weitere Forschungen sein. Sie bietet zwar 
eine Antwort auf einige Fragen, aber alle möglichen Fragen endgültig zu beant- 
worten habe auch ich mit dieser Untersuchung nicht geschafft. Gerade das macht 
die Partikelforschung m.E. so spannend: Obwohl man immer weiter voran- 
kommt, bleibt immer noch etwas Geheimnisvolles, das die edle Gesinnung dieses 
Forschungsgegenstands ausmacht. 

In diesem Sinne bin auch dankbar, dass ich überhaupt die Gelegenheit be- 
kommen habe, eine Doktorarbeit zum Thema Modalpartikeln zu verfassen. Die- 
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1 Einführung 


1.1 Zum Anliegen dieser Arbeit 


Seit Harald Weydt im Jahre 1969 sein Buch Abtönungspartikel veröffentlicht hat, 
ist das Interesse an dieser Wortart, die vielfach (wie auch im Folgenden) als Mo- 
dalpartikeln bezeichnet wird, ständig gewachsen. Haben sich vor ihm kaum For- 
scher eingehend mit diesen Wörtern befasst’, so ist die Zahl der einschlägigen 
Studien mittlerweile Legion. Schon ein Blick auf die Literaturliste der vorliegen- 
den Arbeit, die keine vollständige Übersicht der Partikelliteratur bietet, verrät 
den Umfang des Feldes sowie die Vielfalt der Perspektiven, theoretischen Rah- 
men, Herangehensweisen und Methoden, die bei der Partikelforschung bislang 
herangezogen wurden. 

Trotzdem sind viele Fragen zu den deutschen Modalpartikeln bislang noch 
offen geblieben. Auf einige davon hat Werner (2010: 185) hingewiesen: 


Nichts oder nur ansatzweise ausgeführte Fallstudien oder Einordnungen findet man über 
nicht-verbale und paralinguistische MP-kompatible Merkmale wie Gestik, Mimik, Rhyth- 
mus, Intonation bzw. Prosodie [...], systematische Akzentuierung und obligatorische bzw. 
fakultative Betonbarkeit [...]. 


Ähnlich behauptet auch Schulz (2012: 13): 


Spannend wäre, die These zu untersuchen, ob es systematische Zusammenhänge von be- 
stimmten Partikelverwendungen (mit spezifischem Wissensbezug) zur Mimik/Gestik (so- 
wie Intonation) gibt. 


1 Eine wichtige Erklärung ist, dass die Modalpartikeln lange als leere Füllwörter betrachtet wur- 
den, so etwa von Adler (1964) und Reiners (1943). Einige Forscher haben zwar ansatzweise kon- 
trastive Betrachtungen geliefert, u. a. in Vergleichen mit dem Englischen (Collinson 1938, Rattler 
1943, Schubiger 1965) und dem Russischen (Arndt 1960), aber es handelt sich nicht um systema- 
tische Analysen. Etwa zeitgleich mit Weydts Buch sind (größtenteils unabhängig voneinander, 
vgl. Harden 1983: 15) zwar noch einige weitere Arbeiten zu den Partikeln entstanden - Krivono- 
sovs schon 1963 vollendete aber erst 1977 veröffentlichte Dissertation sowie einige Aufsätze sei- 
ner Hand (1965a,b; 1966) und ein Aufsatz von Kawashima (1965) — die aber vor allem anfangs 
weniger rezipiert wurden, sodass Weydts Buch im Allgemeinen als Anfang der modernen Parti- 
kelforschung betrachtet wird. 


DOI 10.1515/9783110566260 
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Bei den multimodalen Aspekten der Verwendung von Modalpartikeln scheint es 
sich also um einen noch weitgehend unerforschten Bereich zu handeln. An sich 
ist dies nicht verwunderlich, da sich die Multimodalitätsforschung selber auch 
noch in vollem Wachstum befindet. Das Ziel der vorliegenden Arbeit ist es, diesen 
Bereich der multimodalen Partikelforschung zu sondieren und so erste Ansätze 
für ein besseres Verständnis der multimodalen Aspekte des Partikelgebrauchs im 
Deutschen zu liefern. Im Anschluss an Schulz’ Beobachtung soll dabei vor allem 
die Gestik zentral stehen; andere multimodale Größen wie Köperhaltung und 
Blickverhalten können im Rahmen dieser Arbeit nur ansatzweise angesprochen 
werden. 

Angesichts des Anliegens dieser Arbeit, den Bereich der multimodalen Parti- 
kelforschung zu erkunden, werden im Folgenden die Ergebnisse einer konstruk- 
tionsgrammatisch orientierten Korpusuntersuchung vorgestellt, bei der die ges- 
tischen Aspekte der Verwendung von Modalpartikeln im Deutschen fokussiert 
werden. Konkret werden drei Cluster von Elementen untersucht, die onomasio- 
logisch definiert sind und sich jeweils um zwei oder drei traditionelle Modalpar- 
tikeln zentrieren: Frageanknüpfer (denn, eigentlich), Bekanntheitsmarkierer (ja, 
doch) und Evidenzmarkierer (eben, einfach, halt).” Das Anliegen dieser Arbeit 
geht jedoch über die multimodale Analyse dieser sieben Partikeln hinaus und 
umfasst ebenso die Beleuchtung einiger damit zusammenhängender theoreti- 
scher Aspekte. Dementsprechend lassen sich die Forschungsfragen in einer the- 
oretischen und einer empirischen Gruppe aufteilen. In dieser Reihenfolge seien 
sie jetzt vorgestellt. 


1.1.1 Theoretische Forschungsfragen 


Wie angesprochen, ist das zentrale Thema der vorliegenden Arbeit die Frage, wel- 
che Rolle Gestik bei der Vermittlung abtönender Bedeutungen spielt bzw. wie die 
Interaktion zwischen verbalen Abtönungsmitteln (insbesondere Modalpartikeln) 
und multimodalen Größen (insbesondere Gestik) aussieht. Wenngleich diese 
Frage eine systematische Darlegung der vorzufindenden Korrelationen zwischen 
Partikeln und Gesten voraussetzt, reicht das Anliegen dieser Arbeit durchaus 
weiter, als nur die Beschreibung der analysierten Modalpartikeln auf multimoda- 
ler Ebene zu erweitern. Tatsächlich erfordert die zu beschreibende Analyse einige 


2 Eingehendere Erläuterungen zur Definition und Abgrenzung dieser Cluster finden sich im Ab- 
schnitt 1.1.2 sowie in den Abschnitten zu den jeweiligen Partikeln im nächsten Kapitel. 
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theoretische Überlegungen, sowohl zum Forschungsobjekt als auch zum theore- 
tischen Rahmen. Daher soll vor der Besprechung der Untersuchung auf die ein- 
zelnen Hauptbegriffe des Titels dieser Arbeit (Modalpartikeln, Konstruktionen 
und Multimodalität) weiter eingegangen werden. 

Im Falle der Multimodalität wird es sich vor allem um eine Stellungnahme in 
diesem breiten Feld handeln. An erster Stelle soll geklärt werden, was in vorlie- 
gender Arbeit unter ‚Multimodalität‘ verstanden wird bzw. wie sich die Arbeit zu 
anderen Untersuchungen in diesem Forschungsbereich verhält und warum. Da 
die Gestik im Zentrum der Beobachtung steht, soll diese auch schon im theoreti- 
schen Teil fokussiert werden. Eine allgemeingültige Definition des Begriffs ‚Ges- 
tik‘ steht allerdings noch aus, so dass insbesondere darauf einzugehen ist, von 
welchem Gestikkonzept in vorliegender Arbeit ausgegangen wird und welche Di- 
mensionen des breiten Gestikfeldes im Rahmen dieser Analyse besondere Be- 
obachtung verdienen. Dieser Schritt beinhaltet zwar eine kritische Auseinander- 
setzung mit bestehender Literatur, dient aber an erster Stelle der Situierung der 
Arbeit; die Begriffe ‚Multimodalität‘ und ‚Gestik‘ an sich werden nicht hinterfragt. 

Anders sieht es bei den beiden anderen Kernbegriffen (Modalpartikeln und 
Konstruktionen) aus. Für diese beiden stellt nämlich der Einbezug von Multimo- 
dalität eine Herausforderung dar. Nicht nur wurden die multimodalen Aspekte 
des Gebrauchs von Modalpartikeln bisher kaum erforscht; auch explizit kon- 
struktionsgrammatisch gerahmte multimodale Analysen sind bislang eher sel- 
ten. Somit ist auf die Frage einzugehen, wie sich Multimodales konstruktions- 
grammatisch analysieren lässt bzw. wie ein multimodaler Konstruktionsbegriff 
zu konzipieren ist. Auch der Modalpartikelbegriff dürfte infolge des Einbezugs 
der Multimodalität einer Neuüberdenkung bedürfen. Tatsächlich stellt sich die 
Frage, welche Rolle die Multimodalität bei den Modalpartikeln spielen kann und 
inwiefern das Multimodale an sich die Form einer Modalpartikel ausmachen 
kann. Zu klären ist zum Beispiel, ob es Modalpartikelgesten gibt (d. h. Gesten, die 
unabhängig von verbal explizierten Partikeln die Bedeutungsnuance einer Mo- 
dalpartikel vermitteln) und wie sich diese dann zu den traditionellen Modalpar- 
tikeln verhalten. Diese Diskussion über die Natur des Partikelbegriffs wird an sich 
auch ihre Auswirkungen auf den Konstruktionsbegriff haben, und diese zu er- 
kunden ist ebenfalls eines der Ziele der vorliegenden Arbeit. 

Obwohl die vorliegende Arbeit an erster Stelle eine empirische Arbeit ist, in 
der die Ergebnisse einer Korpusuntersuchung zu drei Partikelclustern bespro- 
chen werden sollen, sind also auch mehrere theoretische Fragen zu behandeln. 
Zum Teil können diese in der theoretischen Diskussion am Anfang (Kapiteln 2-4) 
beantwortet werden, zum Teil aber werden sich die Antworten erst im Laufe der 
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Analyse herausstellen. Insgesamt handelt es sich um drei theoretische For- 
schungsfragen, die sich folgendermaßen zusammenfassen ließen: 


(T1) Welche Rolle spielen multimodale Größen (insbesondere die Gestik) bei der 
Verwendung von Modalpartikeln, und welche Auswirkungen haben sie auf 
das traditionelle Konzept einer Modalpartikel? 

(T2) Welche Stelle nehmen die für Abtönung relevanten Gestikmuster im weiten 
Feld der Gestik ein bzw. welche Arten von Gesten können zur Abtönung bei- 
tragen? 

(T3) Welche Herausforderungen stellt die Analyse von Multimodalem für die Kon- 
struktionsgrammatik bzw. wie ist ein multimodaler Konstruktionsbegriff zu 
konzipieren? 


1.1.2 Empirische Forschungsfragen 


Die Anmerkung, dass eine befriedigende Antwort auf diese theoretischen For- 
schungsfragen erst nach der Analyse der Ergebnisse der Korpusstudie geliefert 
werden kann, betrifft insbesondere die erste theoretische Frage (T1). Die Antwort 
wird nämlich aus der empirischen Variante dieser Frage abzuleiten sein: Welche 
Rolle spielt die Gestik konkret bei den drei im Folgenden zu analysierenden Par- 
tikelclustern, und um welche Arten von Gesten handelt es sich? Ähnlich kann 
auch die zweite theoretische Frage (T2) nach der Position der relevanten Gesten 
im breiten Gestikfeld erst beantwortet werden, nachdem herausgefunden wurde, 
mit welchen Gesten die zu analysierenden Modalpartikeln korrelieren. Da nur 
drei Partikelcluster eingehend studiert werden, ist beim Verallgemeinern der em- 
pirischen Ergebnisse und Schlussfolgerungen hin zu den theoretischen Fragen 
T1-2 eine gewisse Vorsicht geboten, aber jedenfalls werden die Daten erlauben, 
zum einen die Fragen zumindest für die analysierten Partikeln zu beantworten, 
und so zum anderen zumindest einen ersten Eindruck von der Rolle von Gestik 
bei den Modalpartikeln im Allgemeinen zu erlangen. 

Insgesamt sollen drei Gruppen von Partikeln untersucht werden, die onoma- 
siologisch definiert sind und jeweils zwei oder drei ‚etablierte‘ Modalpartikeln als 
zentrale Elemente haben. Gemeint sind Elemente, deren Einstufung als Modal- 
partikel heutzutage als eher unkontrovers gelten kann. Es handelt sich um Parti- 
keln, die eine Frage in den Gesprächszusammenhang einbinden (denn, eigent- 
lich), um solche, die markieren, dass das Gesagte als wahr gelten kann bzw. dem 
Hörer bekannt sein dürfte (ja, doch), sowie um solche, die andeuten, dass das 
Gesagte als evident oder unleugbar gelten kann (eben, einfach, halt). Die beiden 
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letzteren Cluster gehören etwas enger zusammen, da die Evidenz eines Sachver- 
halts im Prinzip eine konzeptualisierte Wahrheit voraussetzt. Außerdem weisen 
diese beiden Partikelgruppen weitere Ähnlichkeiten auf, u. a. auf der Ebene der 
Satztypendistribution. Trotzdem werden die Evidenzmarkierer separat betrach- 
tet, da sie - eben aufgrund dieser Evidenzbedeutung - eine Sondergruppe inner- 
halb des größeren Feldes der Wahrheitsmarkierer darzustellen scheinen, was 
sich auch in der Gestikanalyse widerspiegeln wird. Aus diesem Grund erhalten 
sie auch in vorliegender Arbeit einen Sonderstatus den ‚einfachen‘ Wahrheits- 
markierern gegenüber. 

Für die Auswahl dieser drei Cluster sind mehrere Gründe zu nennen. Ein 
wichtiger Teil der Erklärung ist die Frequenz der Partikeln. Die zu erforschende 
Partikelliste umfasst die zwei häufigsten Modalpartikeln des Deutschen (ja und 
doch), daneben auch die häufigste Partikel in Fragen (denn), und auch die ande- 
ren zu analysierenden Partikeln gehören nicht zu den seltensten (vgl. u. a. Hent- 
schel 1986: 247). Offenbar handelt es sich also um wichtigere Elemente der deut- 
schen Sprache, aber vor allem erhöht diese Auswahl die Wahrscheinlichkeit, 
dass für die Analyse eine breitere Datenbasis zur Verfügung steht. 

Ein weiterer Faktor, der bei der Auswahl der Partikeln eine Rolle gespielt hat, 
ist die Nlokutionstypendistribution. Tatsächlich sind mit diesen sieben Partikeln 
die wichtigsten Illokutionstypen des Deutschen vertreten: Fragen (denn, eigent- 
lich, doch, einfach), Assertionen und Aufforderungen (ja, doch, eben, einfach, 
halt) und Wünsche (doch). Auch wenn aufgrund der Distribution im Korpus die 
Verwendungen in Aufforderungen und Wünschen nur kurz angesprochen wer- 
den können, kann also mit nur wenigen Partikeln ein diverses Bild angestrebt 
werden, das einen Überblick über die unterschiedlichen Äußerungstypen gibt. 

Darüber hinaus, und das ist zugleich ein dritter Aspekt der Motivation der 
Partikelwahl, erlauben diese Partikeln weitere Vergleiche. Vor allem die beiden 
Cluster der Bekanntheit und der Evidenz sind hier anzusprechen, da diese sich 
dadurch unterscheiden, dass ersterer eine allgemeinere, letzterer eine spezifi- 
schere (und daher potenziell stärkere) Bedeutung zum Ausdruck bringt. Es wäre 
zu sehen, ob sich dies in den multimodalen Realisierungen spiegelt. Zudem wäre 
der Unterschied zwischen diesen beiden Clustern mit (selber zusammenhängen- 
den) Faktoren wie Frequenz und Grammatikalisierung zu verknüpfen. Auch in 
dieser Hinsicht wäre also ein Vergleich interessant, nämlich im Hinblick auf die 
Frage, ob sich Korrelationen zwischen den multimodalen Aspekten der Partikel- 
verwendung und Faktoren wie Frequenz oder Spezifizität der Bedeutung finden 
lassen. 
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Insbesondere für das Einbeziehen des Evidenzclusters gibt es noch einen 
vierten Grund. In der Literatur wurden schon mehrere Thesen zum genauen Ver- 
hältnis bzw. Unterschied zwischen diesen Partikeln (insbesondere zwischen 
eben und halt) formuliert (s. Abschnitt 2.3.3). Allerdings sind diese Thesen nicht 
immer miteinander verträglich und bislang besteht kein allgemeines Einver- 
ständnis darüber, welche These den anderen vorzuziehen wäre. Es ist nicht aus- 
zuschließen, dass eine Gestikanalyse diesbezüglich Aufschluss bringen könnte. 
Sollten nämlich diese Partikeln unterschiedliche Gestendistributionsmuster auf- 
weisen, so könnten diese tatsächlich auf Unterschiede in der Bedeutung oder 
Verwendung der Partikeln hinweisen. Ähnlich könnte die Gestikanalyse ein 
neues Licht auf das Verhältnis zwischen den analysierten Partikeln und anderen 
Elementen mit ähnlichen Funktionen werfen, die nicht unbedingt der traditio- 
nellen Kategorie der Modalpartikeln angehören. 

In dieser Hinsicht werden also nicht nur die Partikeln selber analysiert: Zu 
Vergleichszwecken werden auch andere verbale Elemente herangezogen, die 
derselben Funktionsdomäne angehören aber nicht unbedingt zu den Modalpar- 
tikeln gezählt werden. Darüber hinaus wird auch das Vorkommen der relevanten 
Gestikmuster im Allgemeinen untersucht. Tatsächlich können auch die partikel- 
losen Kontexte, in denen die Gesten eingesetzt werden, zu relevanten Einsichten 
führen, die sich nicht nur auf die Gesten selber, sondern ebenfalls auf die mit 
ihnen gemeinsam vorkommenden Partikeln beziehen können: Die Häufigkeit der 
Verwendung in anderen Kontexten bzw. mit anderen verbalen Elementen kann 
ein interessanter Hintergrund sein, vor dem die Korrelation der Gesten mit den 
untersuchten Partikeln zu interpretieren wäre. 

Im Grunde genommen sind die empirischen Zielsetzungen also Ausarbeitun- 
gen der ersten theoretischen Forschungsfrage (T1), die sich auf die Rolle der Ges- 
tik bei der Verwendung von Modalpartikeln bezieht. Konkret ließen sich aus T1 
folgende empirische Forschungsfragen ableiten: 


(E1) Welche Rolle spielt die Gestik bei der Verwendung der hier zu erforschenden 
Modalpartikeln? Mit welchen Gestikmustern kookkurrieren sie, und in wel- 
chem Maße? 

(E2) Welchen Beitrag leistet die Gestikanalyse zur Diskussion über das Verhältnis 
zwischen den Partikeln untereinander sowie zwischen den Partikeln und an- 
deren verbalen Elementen der gleichen Funktionsdomäne? 

(E3)Inwiefern können die Gestikmuster auch ohne die verbalen Partikeln ver- 
wendet werden? Inwiefern unterliegen sie dann denselben Restriktionen, 
und was tragen diese Beobachtungen zur Interpretation des Kookkurrenzver- 
haltens der Gesten mit den untersuchten Partikeln bei? 
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Die Diskussion der bislang aufgelisteten theoretischen wie empirischen For- 
schungsfragen ruft allerdings noch weitere Fragen auf, die sich an erster Stelle 
auf die Distribution der Gesten beziehen. Wenn man die Korrelation zwischen 
verbalen und gestischen Ausdrücken untersuchen will, so ist dabei zu berück- 
sichtigen, dass das Auftreten der Gestik durch unterschiedliche sprachliche wie 
nichtsprachliche Faktoren beeinflusst werden könnte. Um welche Faktoren es 
sich handelt und wie stark deren Einfluss ist, bleibt allerdings noch zu klären. 

Eine Sonderstellung diesbezüglich dürften Aspekte wie die Kombination ab- 
tönender Bedeutungen sowie der wiederholte Ausdruck einer und derselben ab- 
tönenden Bedeutung einnehmen. In Übersetzungsanalysen wie Schoonjans/ 
Feyaerts (2010) wurde schon nachgewiesen, dass bei Partikelkombinationen 
häufig nur eine Partikel übersetzt wird, und dass auch bei Partikelreihungen, bei 
denen die gleiche Partikel in aufeinanderfolgenden Äußerungen bzw. Äuße- 
rungseinheiten eingesetzt wird, die abtönende Bedeutung in der Übersetzung 
häufig nur einmal expliziert wird. Auch wenn sich eine solche Übersetzungsana- 
lyse nicht unbedingt direkt mit einer Gestikanalyse vergleichen lässt, suggerieren 
diese Daten doch, dass Kombinationen bzw. Reihungen abtönender Elemente 
eine Sonderstellung einnehmen, die sich auch in der Gestik spiegeln könnte, zu- 
mal Analysen ikonischer Gesten gezeigt haben, dass die Gesten bei Wiederholun- 
gen oft in abgeschwächter Form vorliegen (u. a. McNeill 1992: 175). 

Allerdings sollte bei der Analyse von Reihungen und Kombinationen noch 
ein Schritt weiter gegangen werden, als nur den Einfluss dieser Faktoren auf ver- 
baler Ebene auf die Gestik zu untersuchen: Es sollte auch der umgekehrte Weg 
gegangen werden. Tatsächlich ist nicht auszuschließen, dass eine Geste wieder- 
holt eingesetzt wird. In diesem Fall wäre auch zu klären, wie es mit einer etwai- 
gen Wiederholung der verbalen Partikel aussieht. Ähnlich wäre der Frage nach- 
zugehen, ob auch auf gestischer Ebene abtönende Bedeutungen kombiniert 
werden können, und was sich über solche Fälle im Hinblick auf die verbale Ebene 
aussagen ließe. Schließlich könnte man sich auch fragen, ob es möglich ist, ab- 
tönende Bedeutungen zu kombinieren, die je in einem eigenen semiotischen Ka- 
nal ausgedrückt werden (d. h. eine Bedeutung verbal, die andere gestisch). 

Diese weiterführenden empirischen Forschungsfragen ließen sich also fol- 
gendermaßen zusammenfassen: 


(E4)Welche sprachlichen wie nichtsprachlichen Faktoren beeinflussen die Distri- 
bution der relevanten Gestikmuster? 

(E5) Inwiefern weisen isoliert auftretende Modalpartikeln andere Kookkurrenz- 
muster mit Gestik auf als gereihte oder kombinierte Partikeln? Lassen sich 


8 — Einführung 


auch die Gesten reihen bzw. kombinieren, und was ist in dem Fall über das 
Verhalten verbaler Partikeln auszusagen? 


1.2 Zum Aufbau dieser Arbeit 


Die Zweiteilung in theoretische und empirische Forschungsfragen spiegelt sich 
auch im Aufbau der vorliegenden Arbeit. Tatsächlich lassen sich die weiteren Ka- 
pitel in zwei größere Gruppen aufteilen: eine eher theoretische Besprechung der 
zentralen Konzepte in den Kapiteln 2-4, zum einen, und die Darstellung und Dis- 
kussion der Ergebnisse der empirischen Analyse in den Kapiteln 7-14, zum an- 
deren. Getrennt werden diese beiden Teile durch einige methodische Angaben in 
den Kapiteln 5-6. 

Der theoretische Teil ist so aufgebaut, dass jedem der drei Kernbegriffe des 
Titels der Arbeit ein Kapitel gewidmet ist: den Modalpartikeln, der Multimodali- 
tät und dem Konstruktionsbegriff. Die Funktion dieser Kapitel ist an erster Stelle 
situativ-definitorisch: Es wird jeweils dargelegt, wie diese Begriffe in vorliegen- 
der Arbeit aufgefasst werden und welche Stelle die Arbeit in den entsprechenden 
Forschungsdomänen einnimmt bzw. wie sie sich zu anderen Arbeiten in diesen 
Domänen verhält. Fokussiert werden dabei die oben dargelegten theoretischen 
Forschungsfragen sowie die Frage, welche Implikationen diese Fragen für die zu 
vertretende Auffassung der drei Grundbegriffe haben und umgekehrt. Es soll mit 
anderen Worten ein Denkrahmen geboten werden, in dem sich im Laufe der Ar- 
beit die Antworten entwickeln werden, und ausgehend von dieser theoretischen 
Diskussion sollen einige Ansätze und Denkanstöße geliefert werden, die die Su- 
che nach den Antworten in der empirischen Analyse steuern sollen. 

Der Schwerpunkt der Arbeit liegt jedoch bei der empirischen Analyse der Kor- 
pusdaten. Sieht man von den methodischen Angaben (eine kurze Vorstellung der 
verwendeten Korpusdaten sowie einige weiterführende Informationen zu den 
Annotations- und Analyseverfahren) in den Kapiteln 5-6 ab, lässt sich im empi- 
rischen Teil im Grunde genommen eine zweigliedrige Struktur ausmachen: Nach- 
dem in den Kapiteln 7-10 die konkreten Ergebnisse vorgestellt worden sind, er- 
folgt in den Kapiteln 11-14 eine Diskussion dieser Ergebnisse im Hinblick auf die 
oben aufgelisteten Forschungsfragen. Die Präsentation der Ergebnisse in den Ka- 
piteln 7-10 erfolgt nicht nach Partikelcluster, sondern unter der Form von Fall- 
studien, in denen jeweils eine bestimmte Geste fokussiert wird, die in den Kor- 
pora mit einer bestimmten Partikel bzw. mit bestimmten Partikeln korreliert. 

Abgeschlossen wird die Arbeit mit einer Übersicht der wichtigsten Schluss- 
folgerungen sowie einer Zusammenfassung der Antwort auf die Forschungsfra- 
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gen. Zudem wird ein kurzer Ausblick geliefert, und im Anhang werden eine zu- 
sammenfassende Übersicht der Transkriptionskonventionen und weitere Anga- 
ben zu den einzelnen Korpusdateien geliefert. 


Sofern sie nicht auf konkrete Personen in den Beispielen verweisen, sind Bezeich- 
nungen wie ‚Sprecher‘ und ‚Hörer‘ in vorliegender Arbeit als geschlechtsneutral 
zu interpretieren. 


2 Modalpartikeln 


2.0 Einführung 


In diesem und den beiden nächsten Kapiteln werden die drei zentralen Begriffe 
des Titels der Arbeit eingehender besprochen: ‚Modalpartikel‘, ‚Multimodalität‘ 
und ‚Konstruktion‘. Als erstes wird auf das Forschungsobjekt eingegangen: die 
Modalpartikeln. Obwohl sie spätestens seit Weydt (1969) eine zentrale Stelle in 
der germanistischen Forschung eingenommen hat (vgl. Abschnitt 1.1), herrscht 
bislang keine Einigkeit darüber, wie sich diese Kategorie definieren lässt und 
welche Elemente als Modalpartikeln einzustufen sind. Moroni (2010: 3) formu- 
liert es folgendermaßen: 


In der Forschung herrscht Uneinigkeit darüber, welche Lexeme zur Gruppe der Modalpar- 
tikeln zu zählen sind. Dies liegt daran, dass je nach Ansatz unterschiedliche Eigenschaften 
als Kriterien für die Abgrenzung dieser Gruppe festgelegt werden. 


Deswegen soll in diesem Kapitel geklärt werden, wie der Terminus ‚Modalparti- 
kel‘ in der vorliegenden Arbeit verstanden wird. 

Das Kapitel besteht aus drei Teilen. In einem ersten Schritt (2.1) wird ein all- 
gemeines Bild der Kategorie der Modalpartikeln geliefert: Nach der Besprechung 
einiger klassischer und gängiger Definitionen der Kategorie wird auf die Frage 
der Bedeutung bzw. Funktion der Modalpartikeln eingegangen, die selber zwar 
auch Kontroversen ausgelöst hat, jedoch weniger direkt in Bezug auf die Defini- 
tion bzw. Abgrenzung der Kategorie. Die definitorischen Kontroversen werden im 
Abschnitt 2.2 thematisiert. Gezeigt werden soll, dass sowohl auf interner (inten- 
sionaler wie extensionaler) als auch auf externer Ebene Anlässe zur Diskussion 
bestehen, die es zu überdenken gilt, bevor man den Terminus ‚Modalpartikel‘ 
weiter einsetzt. Nach dieser eher theoretischen Reflexion werden im Abschnitt 2.3 
die in der vorliegenden Arbeit analysierten Partikelcluster etwas ausführlicher 
vorgestellt. 


2.1 Allgemeine Beobachtungen 


Wenn man sich ein allgemeines Bild von der Kategorie der Modalpartikeln schaf- 
fen will, muss man sich eine doppelte Frage stellen: Wie sehen die Modalparti- 
keln aus, und was leisten sie? Wie weiter unten (2.2.1.1) noch gezeigt werden soll, 
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hat vor allem die erste der beiden Fragen Kontroversen in der Welt der Partikel- 
forschung ausgelöst. Allerdings scheint es wünschenswert, zunächst anhand ei- 
niger gängiger Definitionen ein allgemeines Bild zu kreieren, bevor auf die Kont- 
roversen eingegangen wird, und zwar sowohl für die Bedeutung (2.1.1) als auch 
für die formalen Merkmale (2.1.2.). 


2.1.1 Funktionsbeschreibung der Modalpartikelkategorie 


Im einführenden Kapitel wurde schon erwähnt, dass auf die Kategorie der Mo- 
dalpartikeln mit unterschiedlichen Termini verwiesen wird. Die beiden gängigs- 
ten in der heutigen Forschungsliteratur sind Modalpartikeln und Abtönungspar- 
tikeln; andere Bezeichnungen, die sich in der einschlägigen Literatur finden 
lassen, sind u. a. Einstellungspartikeln, Illokutionspartikeln, Präsuppositionspar- 
tikeln, Gesprächspartikeln und Satzpartikeln. Vor dem Aufschwung der Partikel- 
forschung mit dem Erscheinen von Harald Weydts Buch Abtönungspartikel im 
Jahre 1969 wurden auch Begriffe wie Färbewörter, Füllwörter, Flickwörter und 
Würzwörter verwendet, die für das damalige negative Bild der Modalpartikeln 
(„Läuse in dem Pelz unserer Sprache“ nannte sie Reiners 1943: 340) symptoma- 
tisch sind. Mit der allmählichen Aufwertung dieses Bildes sind diese Bezeichnun- 
gen jedoch außer Gebrauch geraten. 

In dieser Hinsicht scheint es angemessen, mit einer terminologischen An- 
merkung anzufangen. Wenn in der vorliegenden Arbeit von Modalpartikeln die 
Rede ist, so liegt das daran, dass dies die heutzutage gängigste Bezeichnung die- 
ser Kategorie zu sein scheint. Der Terminus ‚Modalpartikel‘ wird hier also völlig 
synonym mit ‚Abtönungspartikel‘ verwendet; die u. a. von Ballweg (2007), Schulz 
(2012) und Hoffmann (2013) vertretene Position, den Begriff ‚Modalpartikel‘ zur 
Bezeichnung der modalen (Satz)Adverbien einzusetzen, wird nicht übernom- 
men. Ähnlich wird von Waltereits (2006) Vorschlag abgewichen, die Bezeich- 
nung ‚Abtönungspartikel‘ für alle Partikeln einzusetzen, die eine abtönende 
Funktion haben können, egal, ob sie der Klasse der Modalpartikeln im herkömm- 
lichen Sinne angehören oder nicht; abtönende Elemente, die nicht zu den Modal- 
partikeln gehören, werden im Folgenden einfach mithilfe des attributiven Adjek- 
tivs ‚abtönend‘ bezeichnet. 

Vergleicht man nun die oben aufgelisteten Bezeichnungen dieser Kategorie, 
so fällt auf, dass sie nahezu ausnahmslos auf die Funktion dieser Partikeln ver- 
weisen. Dies zeigt sich sowohl bei den älteren, abwertenden Termini (Lücken 
ausfüllen, den Diskurs ‚zusammenflicken‘ bzw. ‚würzen‘) als auch bei den weni- 
ger negativ konnotierten Begriffen (eine modale Nuance zum Ausdruck bringen, 
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die Äußerung abtönen, eine Sprechereinstellung markieren usw.). Die termino- 
logische Vielfalt scheint also zu suggerieren, dass sich die Geister an der Frage 
scheiden, welchen Beitrag zur Kommunikation die Partikeln leisten. 

Die erste Frage, die diesbezüglich gestellt werden soll, ist, ob die Modalpar- 
tikeln überhaupt einen richtigen Beitrag liefern, oder ob sie wirklich nur als leere 
Hülsen dastehen. Anders formuliert: Haben die Modalpartikeln eine Bedeutung? 
Für Reiners ist die Antwort eindeutig negativ. Aus konstruktionsgrammatischer 
Sicht dagegen kann sie nur positiv sein. Die Partikeln dienen gewiss einem be- 
stimmten Zweck, wenn auch für manche nur, den Diskurs zu ‚würzen‘. Sie haben 
also eine Funktion und können daher nicht bedeutungslos sein.' Ähnlich argu- 
mentiert außerhalb des konstruktionsgrammatischen Rahmens u. a. auch Wal- 
tereit (2006: 8), dass Modalpartikeln nicht als bedeutungslos betrachtet werden 
können, weil sie nicht funktionslos sind. 

Spätestens seit Weydt (1969) ist allerdings die Ansicht gewachsen, dass Mo- 
dalpartikeln mehr leisten, als bloß Äußerungen zu ‚würzen‘. Folgende Definition 
der Kategorie ‚Modalpartikel‘, die von Luise Liefländer-Koistinen (2004: 550) vor- 
geschlagen wurde, liefert einen ersten Eindruck davon, wie die Abtönungsfunk- 
tion im Allgemeinen konzipiert wird: 


Modalpartikeln sind unflektierbare Wörter, die die Einstellung des Sprechers hinsichtlich 
der vom Hörer erwarteten situationsbezogenen Haltung, dessen Vorwissen und Reaktion 
signalisieren. Sie beziehen sich deshalb immer auf eine ganze Äußerung und nie auf ein 
einzelnes Wort und verleihen der Äußerung eine zusätzliche Bedeutung. 


Anders formuliert: Die Modalpartikeln fügen der Äußerung eine subjektive oder 
intersubjektive Bedeutung hinzu, indem sie die Stellungnahme des Sprechers 
zum Gesagten, zur Beziehung des Gesagten zum Kontext, zur erwarteten Hörerre- 
aktion usw. andeuten. Ähnlich umschrieb diese Funktion der Modalpartikeln 
schon Thurmair (1989: 94): 


Mit Modalpartikeln kann der Sprecher nämlich dem Gesprächspartner Hinweise darauf ge- 
ben, wie er das Gesagte auffassen und wo er es einordnen soll, sowie Hinweise darauf, wie 
der Sprecher die Äußerung bewertet, wie er die Vorgängeräußerung aufgenommen hat oder 
wie er das Wissen und die Erwartungen des Hörers einschätzt. Diese Hinweise soll der Hörer 
natürlich auch in seiner Reaktion berücksichtigen; auf diese Weise ist es auch eine der 
Funktionen der Modalpartikeln, den Gesprächspartner in einer bestimmten Richtung zu be- 
einflussen. 


1 Inder Konstruktionsgrammatik wird im Allgemeinen mit einem breiten Bedeutungsbegriff ge- 
arbeitet, der auch die Diskursfunktion umfasst (vgl. Abschnitt 4.1.1). 
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Diese Umschreibung bedarf einer kurzen Erläuterung. Dass Modalpartikeln 
Sprechereinstellungen markieren, wird spätestens seit Weydt (1969) ziemlich all- 
gemein akzeptiert. Allerdings leisten die Partikeln mehr als bloß anzudeuten, 
welche Stellung der Sprecher zum Inhalt seiner Äußerung einnimmt: Sie haben 
zudem eine intersubjektive und eine konnektierende Bedeutungsfacette. Erstere 
ist in Thurmairs Beschreibung deutlich anwesend: Der Sprecher beachtet nicht 
nur die eigene Position, sondern bezieht auch die Position des Hörers in seine 
Überlegungen ein. Dabei kann es sich sowohl um den Wissensstand oder das Ver- 
halten des Hörers vor der partikelhaltigen Äußerung als auch um dessen erwar- 
tete Reaktion handeln. Tatsächlich kann der Sprecher mittels der Partikel zeigen, 
dass er den Kenntnisstand, die Einstellung und das (verbale oder nonverbale) 
Verhalten des Hörers in Betracht zieht, kann aber zugleich mit der partikelhalti- 
gen Äußerung darauf einzuwirken versuchen. Die Position des Gegenübers wird 
also sowohl berücksichtigt als auch beeinflusst. 

Dass die Modalpartikeln darüber hinaus eine konnektierende Funktion erfül- 
len können, ist ebenfalls spätestens seit Brauße (1985: 142) bekannt. Auch 
Thurmair (1989) schreibt einigen Partikeln das Bedeutungsmerkmal <KONNEX> Zu. 
Gemeint ist damit, dass die Äußerung durch die Partikel an einen Aspekt der Ge- 
sprächssituation angeknüpft wird.’ Dieser Aspekt kann der Inhalt einer Vorgän- 
geräußerung sein,’ aber ebenso kann an Nonverbales angeknüpft werden, zum 
Beispiel an eine Handlung des Gesprächspartners oder an ein für die Interaktan- 
ten direkt wahrnehmbares Phänomen. 

Die Konnexfunktion ist allerdings kein allgemeines Merkmal der Modalpar- 
tikeln: Bei Partikeln, die an erster Stelle reaktionssteuernd (etwa u. dgl.) oder il- 
lokutionsverstärkend (bloß u. dgl.) wirken, ist sie kaum nachweisbar. Die in der 
vorliegenden Arbeit analysierten herkömmlichen Modalpartikeln (denn, eigent- 
lich, ja, doch, eben, einfach und halt) können alle konnektierend wirken, aber 
auch bei diesen Partikeln handelt es sich nur um ein fakultatives Merkmal, wie 
sich auch in der weiteren Analyse noch zeigen wird.“ Trotzdem sollte diese Kon- 
nexfunktion nicht außer Acht gelassen werden, denn sie spielt eine nicht zu ver- 
nachlässigende Rolle auf der Ebene der Verwendungsbedingungen der Partikeln 


2 Gemeint ist also nicht die von Diewald (u. a. 1997: 77-79 und 2006: 407, 415-418; vgl. auch 
Brünjes 2014: 78-81) beschriebene indexikalische Funktion von Modalpartikeln, auf eine für den 
Sprecher relevante und gegebene (aber partikellose) Sprechaktalternative zurückzuverweisen, 
die durch die Modalpartikel um eine partikelspezifische Semantik ergänzt wird. 

3 Vielfach wird angenommen, es könne sich nur um die direkt vorangehende Äußerung han- 
deln. Deppermann (2009: 27-28) hat aber gezeigt, dass auch auf weiter zurückliegende Äuße- 
rungen oder Geschehnisse Bezug genommen werden kann. 

4 Vgl. zur unterschiedlichen Ausprägung der Konnexfunktion u. a. Franck (1980: 222-223). 
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sowie für die Interpretation der Partikel und der partikelhaltigen Äußerung als 
Ganzes. 

Ein Beispiel dürfte hier etwas mehr Deutlichkeit schaffen. Wie im Abschnitt 
2.3.2 noch ausführlicher dargelegt werden soll, ist die Hauptfunktion der Partikel 
ja, zu markieren, dass der Inhalt des Gesagten dem Sprecher zufolge als wahr 
gelten kann. Durch das explizite (mittels der Modalpartikel) Kommunizieren die- 
ser Sprechereinstellung wird auch angestrebt, dass der Hörer dem Sprecher nicht 
widerspricht: Das Gesagte ist wahr, und mithin wird kein Widerspruch erwartet 
bzw. ist gar kein Raum dafür vorgesehen. Gelegentlich wird auch angenommen, 
dass der Inhalt der Äußerung vielfach nicht nur wahr, sondern zudem dem Hörer 
schon bekannt ist; in diesem Sinne wird also auch der Wissensstand des Hörers 
berücksichtigt. Der fakultative Konnexaspekt besteht darin, dass eine Äußerung 
mit ja vielfach eine Begründung oder Erklärung des Vorangehenden liefert. In- 
wiefern dieser begründende Charakter der Konnexbeziehung durch die Partikel 
selber markiert wird, ist eine noch nicht eindeutig geklärte Frage (siehe Abschnitt 
2.3.2), aber die Partikel hebt zumindest hervor, dass eine Beziehung besteht. 

Dass die Konnexbedeutung fakultativ ist, hängt auch damit zusammen, dass 
die Bedeutung der Modalpartikeln hochgradig kontextsensitiv bzw. kontextab- 
hängig ist. Dies gilt zwar für Bedeutung im Allgemeinen (Langacker zum Beispiel 
setzt Bedeutung mit Konzeptualisierung als aktiven und kontexteingebundenen 
Prozess gleich - siehe u. a. Langacker 1987: 5), aber im Falle der Modalpartikeln 
ist diese Kontextgebundenheit der Bedeutung besonders zu berücksichtigen, da 
die genaue Leistung der Partikel je nach Kontext deutlich unterschiedlich sein 
kann. Ob und inwiefern eine Konnexbedeutung vorliegt, ist eine dieser kontext- 
abhängigen Facetten. Allgemeiner formuliert ist die genaue Nuance, die von ei- 
ner Modalpartikel ausgedrückt wird, sehr stark vom Kontext abhängig, wie sich 
zum Beispiel in Übersetzungsanalysen deutlich zeigt (s. u.a. Schoonjans/ 
Feyaerts 2010, Schoonjans 2014a). Zum Beispiel markiert doch in Assertionen die 
beiden Bedeutungsfacetten ‚Wahrheit‘ und ‚Adversativität‘ (vgl. 2.3.2), aber in 
Aufforderungen kommt im Allgemeinen noch eine illokutionsverstärkende oder 
-abschwächende Nuance hinzu, die allerdings je nach Kontext variieren kann, 
etwa von einem Ratschlag bis hin zu einer Warnung oder Drohung (vgl. Thurmair 
1989: 119).° Ähnlich kann ja unter Umständen auch eine gewisse Adversativität 
in sich tragen und so zum Synonym von doch werden, obwohl diese Adversativi- 
tätsnuance in vielen Fällen nicht Teil der Bedeutung von ja ist (vgl. Schoonjans 
2014). 


5 Aspekte wie die Intonation und der Äußerungstyp, die ebenfalls zum Kontext im breiten Sinne 
zu zählen sind (vgl. Fetzer 2010), spielen hier ebenso eine nicht zu vernachlässigende Rolle. 
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Diese Variabilität der Partikelbedeutungen hat auch Auswirkungen auf die 
Analyse der Partikeln. Es stellt sich nämlich die Frage, ob man für jede Partikel 
eine einzige - kontextuell variable - Bedeutung annehmen soll (sogenannter Be- 
deutungsminimalismus), oder ob mehrere unterschiedliche Bedeutungen unter- 
schieden werden sollen (sogenannter Bedeutungsmaximalismus). Beide Positio- 
nen haben ihre Schwächen. Die minimalistische Herangehensweise beinhaltet 
das Risiko, dass bei der Suche nach einem gemeinsamen Bedeutungsaspekt über 
die kontextuelle Variation hinweggetäuscht wird. Bei der maximalistischen Her- 
angehensweise stellt sich dagegen die Frage, wie viele und welche Bedeutungen 
unterschieden werden sollten, und wie man die Grenze zwischen den unter- 
schiedlichen Bedeutungen zieht.° Außerdem weisen diese unterschiedlichen Be- 
deutungen immer noch eine gewisse kontextuell bedingte Variation auf, sodass 
sich auch hier das größte Problem der minimalistischen Stellungnahme stellt (es 
sei denn, man nehme für wirklich jede Variante eine neue Bedeutung an, was 
allerdings aufgrund der starken Kontextsensitivität weder plausibel noch prak- 
tisch machbar scheint). Aus diesem Grund wird in der vorliegenden Arbeit ver- 
sucht, den goldenen Mittelweg zu gehen, indem bei der allgemeinen Bespre- 
chung der Partikeln im Abschnitt 2.3 einige übergreifende Begriffe vorgeschlagen 
werden, bei der Analyse konkreter Beispiele jedoch durchaus der Kontext für die 
Interpretation im Auge behalten wird. 

Zum Schluss sei noch auf eine dritte Facette der Partikelbedeutung hingewie- 
sen. Neben ihrer (inter)subjektiven und konnektierenden Wirkung agieren die 
Modalpartikeln nämlich auch auf der Ebene des Illokutionstyps. Wie diese Bezie- 
hung zum Illokutionstyp genau aussieht, d. h. ob die Modalpartikeln den Illoku- 
tionstyp nur indizieren oder selber auch modifizieren, ist eine bislang nicht ein- 
deutig geklärte Frage (vgl. u. a. Autenrieth 2002: 24-26 und Brünjes 2014: 11). Im 
Rahmen der vorliegenden Arbeit ist diese Diskussion allerdings auch von gerin- 
gerer Wichtigkeit, sodass hier nicht weiter darauf einzugehen ist; wichtig ist vor 
allen Dingen, dass eine Beziehung zum Illokutionstyp vorliegt, der durch die Par- 
tikeln hervorgehoben wird. Dass eine solche Beziehung besteht, hat aller Wahr- 
scheinlichkeit nach damit zu tun, dass jede Partikel aufgrund ihrer (inter)subjek- 
tiven Bedeutung nur in bestimmten Illokutionstypen verwendet werden kann - 


6 Als Beispiel sei doch angeführt. Während etwa Thurmair (1989) und Lindner (1991) explizit für 
eine minimalistische Stellungnahme argumentieren, unterscheidet Borst (1985) drei „Erschei- 
nungsformen“. Auch Helbig (1977) beschreibt mehrere Varianten, von denen fünf (1, 2, 4, 5, 6) 
als Modalpartikeln einzustufen sind (daneben enthält seine Liste auch die Verwendungen als 
Adverb und Konjunktion). Franck (1980) geht noch weiter und unterscheidet sechs Bedeutungen 
der Modalpartikel doch, gibt allerdings an, dass es sich eigentlich um Varianten einer einzigen 
Bedeutung handle. 
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wie auch in den Darlegungen zu den Einzelpartikeln unter 2.3 zu zeigen sein 
wird.’ Wenn eine bestimmte Modalpartikel eingesetzt wird, so zeigt das zugleich, 
dass die Äußerung den Illokutionstyp (bzw. einen der Illokutionstypen) reali- 
siert, in dem sie vorkommen kann. 

Zusammenfassend ließe sich also festhalten, dass die Modalpartikeln eine 
dreifache Funktion haben: eine (inter)subjektive, die sich als die eigentlich abtö- 
nende umschreiben ließe, eine konnektierende und eine illokutionstypbezogene. 
Für die im Folgenden vorzustellende Studie ist vor allem die abtönende Wirkung 
von Bedeutung, aber auch auf die beiden anderen Facetten soll wiederholt hin- 
gewiesen werden. 


2.1.2 Formbeschreibung der Modalpartikelkategorie 


Oben wurde dargelegt, welche Funktionen die Modalpartikeln erfüllen. Aller- 
dings ist damit die Eigenständigkeit der Kategorie der Modalpartikeln noch nicht 
etabliert worden: Zum einen sind die (inter)subjektiven Nuancen, die die Modal- 
partikeln vermitteln können, so divers, dass die Frage als berechtigt erscheint, ob 
sie tatsächlich gemeinsam als eine Kategorie betrachtet werden können‘, und 
zum anderen sind auch andere Lexeme (u.a. Situativpartikeln? und bestimmte 
Modaladverbien) dazu in der Lage, diese Funktionen zu erfüllen. Das entschei- 
dende bei der Definition des Begriffs ‚Modalpartikel‘ sind die formalen Eigen- 
schaften. Wie schon erwähnt wurde, ist aber gerade die Formseite des Modalpar- 
tikelbegriffs das Thema nicht unwichtiger Diskussionen. Darauf soll im 
folgenden Abschnitt weiter eingegangen werden. Allerdings scheint es nützlich, 


7 Allerdings spielen neben dem Funktions- bzw. Illokutionstyp manchmal auch Aspekte des 
Formtyps (bzw. Satztyps) eine Rolle (Thurmair 1993). Darauf kann jedoch an dieser Stelle nicht 
weiter eingegangen werden. 

8 Waltereit (2006: 62) behauptet allerdings, es sei aufgrund der gelieferten Funktionsbestim- 
mung durchaus gerechtfertigt, von einer Kategorie zu sprechen. Diewald (1997: 78) geht eben- 
falls von einer funktionalen Gemeinsamkeit aus, die sie in der bereits in Fußnote 2 angesproche- 
nen indexikalischen Funktion sieht. 

Auch die Verwendung des Begriffs ‚Abtönung‘ als übergreifende Bezeichnung der Modalparti- 
kelfunktionen wird im Hinblick auf diese Vielfalt gelegentlich in Frage gestellt oder als zu undif- 
ferenziert abgelehnt (vgl. auch Hentschel 2013: 77). Im Anschluss an Waltereits (a. a. O.) Argu- 
ment wird der Begriff in dieser Arbeit jedoch weiter verwendet, allerdings (wie gerade 
angemerkt) lediglich zur Bezeichnung einer der Wirkungsebenen der Partikeln, nämlich der (in- 
ter)subjektiven. 

9 Situativpartikeln sind Partikeln wie allerdings, immerhin, ohnehin und sowieso, die u. a. von 
Helbig (1988) als „erststellenfähige Modalpartikeln“ umschrieben werden, vgl. Abschnitt 2.2.2. 
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schon am Anfang zu versuchen, die formalen Eigenschaften der Modalpartikeln 
zu umreißen, damit ein besserer Eindruck entsteht, was das Wesen der Modal- 
partikeln ausmacht. 

Eines der wichtigsten formalen Merkmale der Modalpartikelkategorie ist un- 
kontrovers und wird auch schon im Namen angedeutet: Es handelt sich um Par- 
tikeln, das heißt Elemente, die keine morphologische Variation aufweisen. Die 
Modalpartikeln sind zwar nicht gänzlich invariabel, aber die vorzufindende Va- 
riation ist nicht morphologischer Natur. Partikeln wie nur und bloß sind zum Bei- 
spiel in Aufforderungen fakultativ betonbar (Thurmair 1989: 22), und einige Par- 
tikeln weisen eine gewisse Variation auf, die mit der für Grammatikalisierung 
typischen Erosion zu verknüpfen ist. So wird zum Beispiel die Partikel denn 
manchmal als [den], manchmal aber auch nur als [an] realisiert (vgl. Thurmair 
1989: 163), und für die Partikel mal lässt sich süddeutsch auch noch die ältere, 
längere Variante einmal vorfinden (vielfach allerdings auch mit von Erosion zeu- 
gender Aussprache, etwa als [a'mall, vgl. Thurmair 1989: 184 und Muhr 2001: 
101-104). Als Inflexibilia sind die Modalpartikeln aber nach wie vor zu betrach- 
ten. 

Allerdings nützt dieses Merkmal für die Abgrenzung der Modalpartikelkate- 
gorie nicht sehr viel, da auch etwa Modaladverbien im Allgemeinen nicht flek- 
tierbar sind. Es sind mit anderen Worten andere Kriterien für die formale Abgren- 
zung heranzuziehen. Als Ausgangspunkt könnte folgende, von Diewald/Kresic 
(2010: 6) vorgeschlagene Definition angeführt werden: 


Sowohl die deutschen Modalpartikeln als auch ihre kroatischen Entsprechungen sind un- 
flektierbar, kommen hauptsächlich in gesprochener Sprache vor, modalisieren die durch 
den jeweiligen Satz ausgedrückte Proposition (in noch näher zu bestimmender Weise), sind 
Synsemantika, sind nicht negierbar, nicht koordinierbar, i.d.R. unbetont, syntaktisch weg- 
lassbar, dialoggrammatisch und pragmatisch jedoch unverzichtbar. Die deutschen Modal- 
partikeln gehören topologisch dem Mittelfeld an. 


Zur „noch näher zu bestimmende[n] Weise“, in der die Modalpartikeln die 
Äußerung modalisieren, wurden oben bereits einige Angaben geliefert. Wichtig 
sind an dieser Stelle vor allem die formalen Eigenschaften. Die wichtigsten von 
Diewald und Kresi€ angeführten Merkmale sind die Mittelfeldstellung, die Ten- 
denz zur Unbetontheit, die Nichtnegierbarkeit und die Nichtkoordinierbarkeit 
(d. h. Modalpartikeln können nicht mittels einer nebenordnenden Konjunktion 
wie und miteinander verknüpft werden). Letzteres Merkmal ist nicht unwichtig, 
da Modalpartikeln durchaus häufig miteinander kombiniert werden (s. etwa 
Thurmair 1989: 203-292). Weitere Merkmale, die gelegentlich angeführt werden 
(u. a. bei Autenrieth 2002: 26 und Diewald 2007: 124-128), sind die fehlende Er- 
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fragbarkeit und Graduierbarkeit (Modalpartikeln können nicht alleine die Ant- 
wort auf eine Frage bilden und lassen sich nicht mittels Elementen wie ganz in- 
tensivieren) sowie die syntaktische wie prosodische bzw. graphische Integriert- 
heit in die Äußerung." 

Diese Merkmale können dazu eingesetzt werden, die Modalpartikeln von ih- 
ren Heterosemen zu unterscheiden. Für alle Modalpartikeln gilt nämlich, dass die 
gleiche Form (sofern nicht durch die oben angesprochene Erosion bereits ein for- 
maler Unterschied zustande gekommen ist) auch noch mit anderen Funktionen 
eingesetzt werden kann. Dies ist darauf zurückzuführen, dass die Modalpartikeln 
durch Grammatikalisierung entstanden sind." Typisch für solche Entwicklungen 
ist das Nebeneinanderbestehen von unterschiedlichen Stadien der Entwicklung 
(sogenannte Divergenz bzw. Schichtung). Diese diachronische Verwandtschaft 
zwischen den einzelnen Formen ist auch der Grund dafür, dass hier von Hetero- 
semie (und contra u. a. Simon 1996: 263 nicht von Homonymie) die Rede ist.” So- 
fern nicht schon die Bedeutung Aufschluss bringt, lassen sich diese Heteroseme 
durch Verweise auf die oben angeführten Merkmale voneinander unterscheiden: 
Das Adjektiv einfach ist flektierbar, das Temporaladverb eben ist erststellenfähig 
(d. h. nicht auf das Mittelfeld beschränkt) usw. Ähnlich lassen sich auf diese 
Weise Modalpartikeln von anderen abtönenden Elementen unterscheiden. So 
sind etwa Modaladverbien und Situativpartikeln durchaus erststellenfähig und 
vielfach auch betonbar. Auch wenn man es also auf den ersten Blick mit einer 
ziemlich heterogenen Sammlung von morphosyntaktischen, phonologischen 
und anderen Merkmalen zu tun hat, so kommt man doch durch diese Kriterien zu 
einem ersten Eindruck dessen, was Modalpartikeln von anderen Abtönungsfor- 
men unterscheidet. 


10 Der Begriff ‚syntaktische Integriertheit‘ ist hier nicht im generativen Sinne gemeint und im- 
pliziert nicht, dass die Partikel Teil einer syntaktischen Struktur oder das Objekt eines syntakti- 
schen Rektionsverhältnisses wäre. Mit ‚Integriertheit‘ wird nur auf die Oberflächenstruktur Be- 
zug genommen, auf der Modalpartikeln nicht wie eine Parenthese eingeschoben und etwa durch 
Tonhöhensprünge oder Kommata vom Rest des Satzes getrennt werden können. 

11 Einige Forscher (u. a. Molnár 2008) sind der Meinung, es handle sich nicht um Grammatika- 
lisierung, sondern um Pragmatikalisierung. Diese Diskussion ist an dieser Stelle von geringerer 
Wichtigkeit, da beide Prozesse die relevanten Parameter (Erosion und Divergenz bzw. Schich- 
tung) aufweisen. 

12 Eine Ausnahme bildet halt, das vermutlich etymologisch nicht mit dem Verb halten (bzw. 
dem Nomen der Halt) verwandt ist (s. u. a. Autenrieth 2002), sodass in diesem Fall durchaus von 
Homonymie die Rede sein sollte. 
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2.2 Das Definitionsproblem 


Oben wurden einige Aspekte einer Definition der Kategorie der Modalpartikeln 
besprochen, aber ein endgültiger Definitionsvorschlag wurde nicht geliefert. Das 
hat damit zu tun, dass bislang kein Einverständnis darüber besteht, was „die“ 
Definition des Begriffs ‚Modalpartikel‘ ist. Tatsächlich wurde im Zitat Moronis 
(2010) am Anfang dieses Kapitels schon gezeigt, dass sich die Forscher nicht dar- 
über einig sind, welche Elemente zu den Modalpartikeln zu zählen sind und wel- 
che Merkmale zur Abgrenzung der Kategorie herangezogen werden sollten. Die 
Auflistung im vorigen Abschnitt ist also ebenfalls nicht frei von Kontroversen. 

Allerdings reicht das Problem weiter als diese ‚interne‘ Definitionsebene. Tat- 
sächlich ist auch die ‚externe‘ Definitionsebene, die sich auf das Verhältnis zu 
bzw. die Abgrenzung von anderen Kategorien bezieht, davon betroffen: Wenn 
nicht klar ist, welche Merkmale eine Kategorie ausmachen, so bleibt ebenfalls zu 
klären, wie sich diese Kategorie von anderen unterscheidet. Im Folgenden sollen 
diese Diskussionen kurz dargestellt werden. Der Übersichtlichkeit halber wird 
zunächst (2.2.1) auf die interne, später auf die externe (2.2.2) Ebene eingegangen, 
obwohl infolge des engen Zusammenhangs der beiden Definitionsebenen wie- 
derholt auf die jeweils andere Ebene zu verweisen ist. Anhand dieser Diskussion 
soll schließlich (2.2.3) gezeigt werden, dass sich die Kategorie der Modalpartikeln 
am besten als prototypikalisch strukturiert verstehen lässt. 


2.2.1 Die interne Definition 


Wie angesprochen, wird auf interner Ebene die Kategorie an sich definiert, ohne 
Bezugnahme auf andere Kategorien. Im Grunde genommen umfasst dies eben- 
falls zwei Dimensionen, die beide schon im oben angeführten Moroni-Zitat ent- 
halten sind: die Intension, d. h. die typischen Merkmale einer Kategorie, und die 
Extension, d. h. die Mitglieder der Kategorie (vgl. Geeraerts 1986: 157). Diese Ebe- 
nen werden im Folgenden zunächst separat angesprochen, aber auch hier gilt, 
dass durch den engen Zusammenhang der beiden Dimensionen die Diskussion 
auf der einen Ebene immer die Diskussion auf der anderen Ebene mit beeinflusst. 


2.2.1.1 Die intensionale Definition 


Wenn man sich die Liste der Merkmale von Modalpartikeln im vorigen Abschnitt 
anschaut, so ähnelt diese einer klassischen aristotelischen Definition mit not- 
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wendigen und ausreichenden Eigenschaften bzw. Bedingungen (vgl. etwa Die- 
wald 2013: 32). Auf prototypische Modalpartikeln dürften sie auch tatsächlich zu- 
treffen. Allerdings lassen sich zu den meisten Merkmalen Gegenbeispiele finden, 
und über einige der Merkmale gehen die Meinungen in der Partikelliteratur deut- 
lich auseinander. Auch wenn die zu analysierenden Partikeln nur zum Teil davon 
betroffen sind, scheint es wertvoll, im Hinblick auf das unten vorzustellende Par- 
tikelkonzept kurz bei diesem Thema zu verweilen. 

Das zweifelsohne am lebhaftesten diskutierte Definitionsmerkmal der Mo- 
dalpartikeln ist ihre (Un)Betontheit. Traditionell wurde davon ausgegangen (u. a. 
Bublitz 1978), dass Modalpartikeln unbetonbar sind. Diese Annahme ist jedoch 
vielfach problematisiert worden. Thurmair (1989: 22) zum Beispiel behauptet, 
dass die Partikel ja in Aufforderungen obligatorisch betont ist (1) und dass auch 
bloß und nur in Aufforderungen durchaus betont werden können. 


(1) Und lassen Sie sich hier JA nicht mehr blicken!” 
(Thurmair 1989: 109) 


Da die betroffenen Partikeln in diesem Fall eine illokutionsverstärkende Wirkung 
haben und der Aufforderung einen warnenden oder drohenden Unterton verlei- 
hen (obwohl nur, mit passender Intonation, auch eine mildernde Wirkung haben 
kann), dürfte die Betonbarkeit mit der Funktion der Partikeln zusammenhängen. 
Dass es sich in diesen Fällen trotz der Betonung um Modalpartikeln handelt, 
scheint heutzutage in der Literatur auch kaum noch hinterfragt zu werden. 

Kontroverser ist die Betonbarkeit von Partikeln wie denn, doch und schon. 
Tatsächlich behaupten u. a. Meibauer (1994) und Abraham (2000), dass auch in 
diesem Fall die Betonung einer Einstufung als Modalpartikel nicht im Wege steht, 
während andere im Anschluss an etwa Thurmair (1989) eine solche Analyse ab- 
lehnen und glauben, es handle sich bei den betonten Varianten vielmehr um Ad- 
verbien oder Fokuspartikeln. Noch einen Schritt weiter als Meibauer und Abra- 
ham geht Ikoma (2007) mit ihrer Behauptung, dass grundsätzlich jede Modal- 
partikel betont werden könne. Es ist im Rahmen dieser Arbeit nicht möglich, aus- 
führlicher auf diese Diskussion einzugehen und zu versuchen, eine klare Grenze 
zu setzen. Festzuhalten ist aber, dass die im empirischen Teil analysierten Parti- 
kelbelege allesamt unbetont sind, woraus sich schließen lässt, dass es sich bei 
der Unbetontheit doch eher um den Normalfall handeln dürfte. 


13 Die Großbuchstaben deuten die Betonung an. 
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Ebenso problematisch erscheint das Merkmal der Mittelfeldstellung. Ge- 
meint ist damit, dass die Modalpartikeln immer zwischen dem finiten Verb und 
etwaigen infiniten Prädikatsteilen (in einem Hauptsatz) bzw. zwischen dem sub- 
ordinierenden Element und der Verbalgruppe (in einem Nebensatz) zu stehen 
hätten. Diese These ist schon alleine aus dem Grund problematisch, dass in der 
gesprochenen Umgangssprache, in der Modalpartikeln ihren Hauptverwen- 
dungsbereich finden, häufig von der traditionellen Felderstruktur der schrift- 
sprachlichen Grammatik abgewichen wird (s. u. a. Imo 2011a). Dementsprechend 
kommt es häufiger vor, dass Elemente, die theoretisch im Mittelfeld stehen soll- 
ten, nach der rechten Verbklammer erscheinen. Dies trifft auch auf Modalparti- 
keln zu, wie Imo selber (2008) für die Partikel halt - eine laut Thurmair (1989) 
prototypische Modalpartikel - gezeigt hat (vgl. auch Ormelius-Sandblom 1997: 
33 zu schon im Nachfeld) (2). Darüber hinaus weist Imo (a. a. O.) auf die Möglich- 
keit der Verwendung von halt im Vorfeld hin, und auch für die südwestdeutsche 
Partikel glaub(e) wurde eine solche Vorfeldstellung schon nachgewiesen 
(Schoonjans 2012: 788-789) (3). 


(2) Ja ich meine, wir sind verwandt halt! 
(FG_AFvid1") 


(3) Ich bin nur echt verzweifelt, sowas zu lesen, und das glaub ist gerade 
jeder hier, der das liest. 
(Schoonjans 2012: 789; Rechtschreibung standardisiert) 


Allerdings lassen sich auch Verstöße gegen die Mittelfeldstellung der Parti- 
keln vorfinden, die nicht auf eine typisch gesprochensprachliche Abweichung 
von der traditionellen Felderstruktur zurückzuführen sind. Ein in der Literatur 
schon häufiger angeführtes Beispiel ist die Stellung direkt nach dem Fragewort 
in Ergänzungsfragen (s. u. a. Thurmair 1989, Meibauer 1994, Ormelius-Sandblom 
1997 und Abraham 2010). In diesem Fall steht also die Partikel gemeinsam mit 
dem Fragewort vor der linken Satzklammer, d. h. im Vorfeld. 


(4) Warum, warum nur ist immer alles so furchtbar für mich? 
(Schoonjans 2013: 136) 


14 Eine solche Quellenangabe deutet daraufhin, dass das Beispiel den eigenen, für diese Arbeit 
verwendeten Korpusdaten entstammt (genauere Angaben dazu sind Kapitel 5 zu entnehmen). 
Der Lesbarkeit halber wurden diese Beispiele allerdings im theoretischen Teil nicht als GAT2- 
Transkripte (siehe 5.2), sondern ‚standardisiert‘ als herkömmliche Sätze wiedergegeben. 
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Des Weiteren scheint bei dieser Diskussion vielfach übersehen zu werden, 
dass Modalpartikeln auch innerhalb von Nominal- oder Präpositionalphrasen 
auftreten können (5-6). In diesem Fall bestimmt die Stellung der partikelhaltigen 
Konstituente, in welchem Feld sich die Partikel befindet. In (5), zum Beispiel, 
steht die Partikel ja im Vorfeld, da die Konstituente, in der sie auftritt, eine Vor- 
feldposition besetzt. 


(5) Dieser ja leider viel zu früh verstorbene Komponist hat uns eine Reihe 
von großartigen Werken überlassen. 
(Thurmair 1989: 27) 


(6) Ich meine „echte“ Valuetitel, sowas wie Coca-Cola, Altria, ihr wisst 
schon... nur mit halt recht hoher Divrendite etc. 
(Schoonjans 2013: 137; Rechtschreibung standardisiert) 


Es sei eingeräumt, dass keine der hier aufgelisteten Ausnahmen als hochfre- 
quent einzustufen ist — die Vorfeldstellung in Ergänzungsfragen kommt in den 
Daten von Schoonjans (2015a) nur bei 2,23% der Partikeln in diesem Fragetyp vor 
— sodass tatsächlich das Mittelfeld der prototypische Erscheinungsbereich der 
deutschen Modalpartikeln zu sein scheint. Es sollte aber festgehalten werden, 
dass es sich eben nur um eine prototypische Stellung handelt. 

Allerdings scheinen auch andere Merkmale gelegentlich Ausnahmen aufzu- 
weisen. Auf Fälle wie das intensivierte ganz einfach und das koordinierte schlicht 
und einfach sei im nächsten Abschnitt ausführlicher eingegangen, da die exten- 
sionale Ebene direkt davon betroffen ist. Was die Koordinierbarkeit betrifft, lässt 
sich aber auch die Struktur halt und eben vorfinden. Diese Struktur ist zugegebe- 
nermaßen eher ungebräuchlich und scheint nicht von allen Deutschsprachigen 
akzeptiert zu werden, aber die Belege zeigen, dass sie durchaus vorkommt. 


(7) Ja, es ist halt und eben schon so, dass die Society krank ist, nicht? 
(Schoonjans 2013: 138) 


(8) Und vertraglich vereinbart ist halt und eben nichts in dieser Richtung, 
da es ökonomischer Selbstmord wäre für jede Agentur, wenn sie sowas 
machen würde. 
(http://www.yachtrevue.at/forum/viewtopic.php?f=36&t=3722, Zugriff 
am 5.12.2013, Rechtschreibung standardisiert) 
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Festzuhalten bleibt also, dass mehrere typische Definitionsmerkmale der Ka- 
tegorie ‚Modalpartikel‘ nur tendenziell gelten und dass auch Kernmitglieder der 
Kategorie wie halt von dieser Problematik betroffen sind. Das impliziert nicht, 
dass diese Kriterien gleich zu verabschieden wären - das wäre wohl auch unrea- 
listisch, da dann kaum noch Definitionsmerkmale übrigblieben. Nur sollte man 
darauf achten, dass sie nicht als absolute Kriterien gelten können und dement- 
sprechend auch nicht für eine aristotelische Definition mit notwendigen und aus- 
reichenden Eigenschaften verwendet werden können. 


2.2.1.2 Die extensionale Definition 

Wie aus der Besprechung im vorigen Abschnitt hervorgeht, hat die Unklarheit auf 
intensionaler Ebene auch ihre Auswirkungen auf die Extension der Kategorie der 
Modalpartikeln. Ob man die betonten Varianten von denn, doch und schon als 
Modalpartikeln betrachten möchte, hängt zum Beispiel davon ab, wie sehr man 
am Prinzip der Unbetontheit festhält. Ähnlich stufen u. a. Hentschel/Weydt 
(2002) sowieso als Situativpartikel ein, weil es erststellenfähig ist, während u. a. 
Helbig (1988) behauptet, trotz seiner Erststellenfähigkeit handle es sich um eine 
Modalpartikel. Allerdings betrifft die Uneinigkeit auf dieser Ebene nicht nur sol- 
che Fälle, die direkt mit der Diskussion zu einem intensionalen Merkmal zu ver- 
knüpfen sind. 

Ein kleiner Einblick in das Feld verschafft Tabelle 1. In dieser Tabelle wird für 
23 Elemente, die gelegentlich als Modalpartikel eingestuft werden, angegeben, 
ob sie von 14 Forschern, die eine ‚geschlossene‘ Aufzählung der Modalpartikeln 
liefern, aufgelistet werden. Wie aus der Tabelle hervorgeht, besteht über die zent- 
raleren Elemente der Kategorie im Allgemeinen Konsens, auch wenn nur neun 
Partikeln in allen herangezogenen Arbeiten aufgelistet werden (auch, bloß, denn, 
doch, eben, ja, mal, nur, schon). Insgesamt variiert die Zahl der aufgelisteten Par- 
tikeln zwischen 14 (Franck 1980) und 32 (Gornik 1998). Zudem sind die Listen 
nicht inklusiv: Die längeren Listen enthalten nicht immer alle Elemente, die auch 
in kürzeren Aufzählungen enthalten sind. Dies zeigt sich auch darin, dass die 
kürzeste Aufzählung (Franck 1980) länger ist als die oben angeführte Liste von 
Elementen, die von allen zitierten Forschern als Modalpartikeln eingestuft wer- 
den: eigentlich, einfach, etwa, halt und ruhig werden von Franck, nicht jedoch 
von allen anderen, als Modalpartikeln aufgelistet. 

Bemerkenswert ist, dass auch drei der Partikeln, die in der vorliegenden Ar- 
beit als Ausgangspunkt für die empirische Analyse genommen werden, von die- 
ser Diskussion betroffen sind: eigentlich, einfach und halt. Auch wenn die Daten 
in Tabelle 1 zeigen, dass diese Elemente in jüngeren Arbeiten im Allgemeinen zu 
den Modalpartikeln gezählt werden, so scheint das zumindest für eigentlich und 
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Tab. 1: Die von unterschiedlichen Forschern aufgelisteten Modalpartikeln 
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aber + + + + + + + + + + 
auch + + + + + + + + + + + + + + 
bloß + + + + + + + + + + + + + + 
denn + + + + + + + + + + + + + + 
doch + + + + + + + + + + + + + + 
eben + + + + + + + + + + + + + + 
eh + + + 
eigentlich + + + + + + + + + + + + 
einfach + + + + + + + + + + + + + 
erst + + + + + + + 
etwa + + + + + + + + + + + + 
gleich + + + + 
halt + + + + + + + + + + + + + 
ja + + + + + + + + + + + + + + 
mal + + + + + + + + + + + + + + 
nicht + + + + + + 
noch + + + 
nur + + + + + + + + + + + + + + 
ruhig + + + + + + + + + + + + + 
schon + + + + + + + + + + + + + + 
sowieso + + + 
vielleicht + + + + + + + + + + + + 
wohl + + + + + + + + + + + + 


einfach noch keine außer Streit gestellte Annahme zu sein. Dies dürfte mit dem 
Grammatikalisierungsgrad zu tun haben: Partikeln wie einfach und eigentlich 
sind noch nicht so stark grammatikalisiert wie etwa ja und doch. Dementspre- 
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chend stehen sie von der Bedeutung her den Quellformen, aus denen sie sich ent- 
wickelt haben (in den beiden Fällen das homophone Adverb), noch näher, und 
weisen Formmerkmale auf, die typisch sind für diese Quellformen, nicht jedoch 
für Modalpartikeln.” Autenrieth (2002) hat zum Beispiel gezeigt, dass einfach 
durchaus eine intensivierte Variante aufweist (ganz einfach) und zudem mit Ele- 
menten wie schlicht koordiniert werden kann. Dementsprechend zweifelt auch 
Autenrieth daran, ob einfach als eine richtige Modalpartikel gelten kann und 
nicht doch eher auch in dieser abtönenden Verwendung als Adverb einzustufen 
wäre. 


(9) Er spielt die Rolle eines Mannes ganz einfach besser als ein wirklicher 
Mann. 
(Schoonjans 2013: 138) 


(10) Die Faktoren, die bei einer solchen Schätzung berücksichtigt werden 
müssen, sind schlicht und einfach nicht objektivierbar. 
(Schoonjans 2013: 138) 


Was in diesem Fall noch erschwerend hinzukommt, ist, dass es sich um ver- 
festigte Einheiten handeln dürfte. Dementsprechend hätte man es hier nicht mit 
einer intensivierten und einer koordinierten Variante der Modalpartikel zu tun, 
sondern mit einer intensivierten und einer koordinierten Variante des Adverbs, 
die sich parallel zur einfachen Form zu modalpartikelähnlichen komplexen Ein- 
heiten entwickelt hätten. Im Grunde genommen ist die extensionale Frage auf 
dieser Ebene also eine doppelte: (1) Ist einfach selber als Modalpartikel einzustu- 
fen, und (2) kann man Strukturen wie ganz einfach und schlicht und einfach - 
sofern man sie als verfestigte Einheiten auffasst — trotz ihrer Komplexität auch 
als Modalpartikeln betrachten? 

Von nicht zu unterschätzender Wichtigkeit für die Beantwortung dieser dop- 
pelten Frage ist auch die externe Definition der Kategorie ‚Modalpartikel‘. Tat- 
sächlich ist für solche Kategorisierungsfragen auch relevant, wie sich die Katego- 
rie der Modalpartikeln zu den anderen betroffenen Kategorien (insbesondere 


15 Vgl. zu eigentlich auch die Diskussion zwischen Kohrt (1988) und Oppenrieder/Thurmair 
(1989). Auch im Fall von denn wird übrigens der Nutzen der Unterscheidung zwischen einer Ver- 
wendung als Adverb und einer Verwendung als Modalpartikel gelegentlich hinterfragt (vgl. u. a. 
Schoonjans 2015b: 19). 

16 Schlicht wird meist nicht zu den Modalpartikeln gezählt, aber Autenrieth (2002: 64-88) zeigt, 
dass dieses Element zumindest beachtliche Ähnlichkeiten zu den Modalpartikeln aufweist. 
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jener der Adverbien) verhält. Daher sei zunächst die externe Definitionsebene 
kurz angesprochen, bevor in den Abschnitten 2.2.3 und 2.3 auf den konkreten Fall 
der hier angesprochenen Partikeln zurückgekommen wird. 


2.2.2 Die externe Definition 


Wie oben schon mehrfach angesprochen wurde, bezieht sich die externe Defini- 
tionsebene auf die Position, die eine Kategorie im Sprachsystem einnimmt, bzw. 
auf ihr Verhältnis zu den anderen Kategorien. Dies ist eng mit der Ebene der in- 
ternen Definition verbunden, da die Art und Weise, wie das Verhältnis zwischen 
zwei Kategorien zu sehen ist, auch davon abhängt, wie die einzelnen Kategorien 
intern definiert werden und umgekehrt. Wenn man zum Beispiel wie Ikoma 
(2007) davon ausgeht, dass Modalpartikeln grundsätzlich betonbar sind, so nä- 
hert sich diese Kategorie jener der Adverbien an, die im Allgemeinen auch betont 
werden können, während die Distanz zwischen den beiden durchaus größer ist, 
wenn man davon ausgeht, dass Modalpartikeln im Gegensatz zu Adverbien im- 
mer unbetont sind. 

Solche Fragen spielen auch eine Rolle, wenn man bestimmen möchte, ob ein 
Element ausreichend grammatikalisiert ist, um es als Modalpartikel einstufen zu 
können. Ihre Tragweite ist allerdings größer und beeinflusst nicht nur Entschei- 
dungen über Grammatikalisierung: Die Positionierung der Modalpartikeln im 
Sprachsystem an sich ist davon betroffen. 

Gelegentlich (u. a. Möllering 2001) wird davon ausgegangen, dass das deut- 
sche System der Wortarten, neben den flektierten Kategorien, auch die Gruppe 
der ‚Partikeln im weiten Sinne‘ enthält, die alle unbeugbaren Wortarten umfasst: 
Adverbien, Präpositionen und Konjunktionen sowie die ‚Partikeln im engeren 
Sinne‘. Letztere Bezeichnung ist ein Oberbegriff, der Elemente wie Modalparti- 
keln, Fokuspartikeln, Antwortpartikeln usw. vereint. Um wie viele Arten von Par- 
tikeln es sich handelt, ist aber bislang nicht endgültig geklärt worden: Möllering 
(2001) unterscheidet sechs Partikeltypen, während Kürschner (*2003) deren sie- 
ben auflistet und Hentschel/Weydt (1990) von acht Partikelklassen ausgehen. 

Diese Uneinigkeit ist zum Teil eben auf die Definitionsproblematik zurückzu- 
führen. Als Beispiel sei auf Elemente wie sowieso und immerhin zurückverwiesen. 
Da diese Elemente aus funktionaler Sicht den Modalpartikeln ziemlich nahe ste- 
hen, betrachtet Helbig (1988) sie auch als Mitglieder der Modalpartikelkategorie. 
Allerdings wurde bereits darauf hingewiesen, dass diese Elemente im Gegensatz 
zu prototypischen Modalpartikeln erststellenfähig sind und (einfacher) betont 
werden können. Aus diesem Grund plädieren Hentschel/Weydt (1990) dafür, sie 
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in eine separate Kategorie einzuordnen, die sie als ‚Situativpartikeln‘ bezeich- 
nen. Die Kulanz im Umgang mit den Beschränkungen hinsichtlich der Betonbar- 
keit und des Stellungsverhaltens bestimmt also, ob man eine separate Kategorie 
für die Situativpartikeln braucht oder ob man sie bei den Modalpartikeln unter- 
bringen kann. 

Auch auf einer höheren Ebene bestehen solche Uneinigkeiten. Es wurde zum 
Beispiel schon die Frage geäußert, ob die Modalpartikeln nicht als Subtyp der 
Diskursmarker zu betrachten wären. Allerdings wäre zunächst zu klären, wie 
man diese Kategorie intern definiert bzw. welche Position sie ihrerseits im 
Sprachsystem einnimmt, was sich im Fall der Diskursmarker als eine noch 
schwierigere Aufgabe herausstellt als im Fall der Modalpartikeln (vgl. u.a. 
Schoonjans 2013). Eine Alternative, die vor allem in formal-generativen Kreisen 
Eingang zu finden scheint, ist die Einstufung der Modalpartikeln (oder gar aller 
Partikeln im engeren Sinne) als Adverbien (u. a. Cardinaletti 2007, 2011), was in- 
sofern logisch wäre, als sich viele Modalpartikeln (direkt oder indirekt) aus Ad- 
verbien entwickelt haben. Zudem sind Modalpartikeln wie Adverbien immer un- 
flektiert, und von der Funktion her ähneln sie zumindest den Modaladverbien. 
Allerdings sind auch hier Unterschiede nachzuweisen: Adverbien sind vielfach 
betonbar, graduierbar, negierbar, koordinierbar, erfragbar und erststellenfähig, 
während typische Modalpartikelbelege diese Merkmale nicht aufweisen. Auch 
hier ist die Stringenz, die bei der Anwendung dieser Kriterien an den Tag gelegt 
wird, also ausschlaggebend für die Frage, wie leicht sich Modalpartikeln tatsäch- 
lich als Adverbien einstufen lassen. Dass Cardinaletti (2007: 90) davon ausgeht, 
dass es sich bei den Modalpartikeln um „besondere“ Adverbien handelt, zeigt 
aber auch, dass wenigstens auf der Ebene der Prototypen ein gewisser Unter- 
schied nachzuweisen ist. 

Die Diskussion lässt sich sogar auf eine fundamentalere Ebene erheben: Gibt 
es überhaupt eine Wortart ‚Modalpartikeln‘? Die meisten oben zitierten Forscher 
sind der Meinung, dass dem so ist, auch wenn die genaue Position, die diese 
Wortart im System einnimmt, je nach Ansatz unterschiedlich ist. Thurmair 
(1989: 9) dagegen geht davon aus, dass mit dem Begriff ‚Modalpartikel‘ nicht eine 
Wortart bezeichnet werde, sondern vielmehr eine Funktion, in der bestimmte Ele- 
mente auftreten können. Sie schlägt daher vor, von einer Wortart ‚Partikeln‘ aus- 
zugehen, die mit der Gruppe der Partikeln im weiteren Sinne übereinzustimmen 
scheint. Die Mitglieder dieser Gruppe könnten unterschiedliche Funktionen er- 
füllen (welche je nach Element unterschiedlich sind) und würden dementspre- 
chend als Modalpartikel, als Fokuspartikel usw. verwendet. 

Als Begründung führt Thurmair die Heterosemie an: Wenn kein Wortarten- 
unterschied vorliegt, so sei ihr zufolge die Polyfunktionalität leichter zu erklären. 
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Auf die Frage einzugehen, inwiefern das tatsächlich der Fall ist, würde an dieser 
Stelle zu weit führen. Allerdings ist Thurmair nicht die Einzige, die auf die Hete- 
rosemie hinweist, um gegen die Annahme der Existenz einer Wortart ‚Modalpar- 
tikel‘ zu plädieren: Ähnlich behauptet Rüttenauer (1983), es handle sich bei den 
Modalpartikeln einfach um eine Gruppe loser Elemente, die auch andere Funkti- 
onen erfüllen können. 

Was in solchen Debatten noch erschwerend hinzukommt, ist, dass gelegent- 
lich mehrere Einteilungen möglich sind. Diewald (2013: 42) behauptet zum 
Beispiel, dass „[t]here may be different categorizations for different purposes at 
the same time“ und dass „[c]lassifications in linguistic research are set up in ac- 
cordance with the epistemological layout of the research to be undertaken.“” 
Dementsprechend ist es auch nicht möglich, an dieser Stelle eine endgültige und 
unzweideutige Positionierung der Modalpartikeln im System der deutschen Spra- 
che vorzunehmen: Je nach Zielsetzung der Analyse empfiehlt es sich zum Bei- 
spiel, von einer wortartenorientierten (Modalpartikeln als Partikeln) oder von ei- 
ner funktionsorientierten (Modalpartikeln als Abtönungsmittel) Einteilung 
auszugehen. 


2.2.3 Modalpartikeln als prototypikalische Kategorie 


Wie aus der oben skizzierten Diskussion hervorgeht, ist eine Definition der Kate- 
gorie ‚Modalpartikel‘ keine Selbstverständlichkeit. Die Erkenntnis, dass Katego- 
rien nicht immer schön aristotelisch mit notwendigen und ausreichenden Eigen- 
schaften abzugrenzen sind, wurde zunächst in der psychologischen Forschung 
zum Thema gemacht, insbesondere in den Arbeiten von Eleanor Rosch (u. a. 
1978, 1988). Später hat sich auch die Linguistik mit dieser Kategorisierungsfrage 
befasst (u. a. Geeraerts 1986, 1997, Geeraerts u. a. 1994, Lakoff 1987, Langacker 
1987). Obwohl sich diese Forscher zunächst vor allem mit nichtlinguistischen Ka- 
tegorien auseinandergesetzt haben, ist mittlerweile die Ansicht gewachsen, dass 
auch linguistische Kategorien prototypikalisch” strukturiert sind (u. a. Company 
Company 2002, Gries 2003, Taylor 71995 und Weber 2010). 


17 Vgl. auch Jacobs’ (2011: 346) These, dass die Lebensfähigkeit bzw. die Anwendbarkeit einer 
Einteilung davon abhängig sei, was man mit ihr erreichen wolle. Ausführlicher dazu auch 
Schoonjans (2013). 

18 Um Ambiguitäten zu vermeiden, werden die Begriffe ‚prototypisch‘ (bzw. ‚Prototypizität‘) 
und ‚prototypikalisch‘ (bzw. ‚Prototypikalität‘) im Folgenden nicht synonym verwendet: Mit 
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Im Lichte dieser Erkenntnis scheint es wertvoll, sich zu überlegen, ob die Ka- 
tegorie der Modalpartikeln nicht ebenso eine prototypikalische ist. Im Grunde ge- 
nommen hat Thurmair (1989) schon einen Vorschlag in dieser Richtung gemacht, 
wenngleich nicht explizit im Rahmen der Prototypenlehre. Trotzdem sind Proto- 
typenansätze in der Partikelforschung bislang eher selten. ® Diewald (2007, 2013) 
gibt zwar an, dass die Kategorie der Modalpartikeln einen Kernbereich und einen 
Randbereich umfasse, scheint aber nicht von den für die Prototypenlehre typi- 
schen vagen Kategoriengrenzen und Übergangsbereichen auszugehen, sondern 
vielmehr anzunehmen, dass sich auch dieser Kernbereich und dieser Randbe- 
reich ziemlich klar abgrenzen ließen. Trotzdem scheint ein prototypenbasierter 
Ansatz für die Analyse der deutschen Modalpartikelkategorie ein geeigneter Aus- 
gangspunkt zu sein, wie im Folgenden dargelegt werden soll. 

Dass Analysen im Rahmen der Prototypenlehre bislang eher selten sind, hat 
vermutlich auch damit zu tun, dass einige Autoren explizit dagegen plädiert ha- 
ben. Rinas (2006: 42) umschreibt diese Herangehensweise zum Beispiel als einen 
Versuch, „einen unfruchtbaren Kriterienkatalog zu retten, indem alle ‚Ausnah- 
men‘ als ‚Idiosynkrasien‘ wegerklärt werden.“ Das Problem ist nun aber, dass die 
‚Ausnahmen‘ so zahlreich sind, dass sich kaum eine Liste von Merkmalen finden 
ließe, die auf alle Belege zutrifft und zudem als ausreichend gelten kann. Höchs- 
tens käme man zu einer Definition, die etwa folgendermaßen aussähe: ‚abtö- 
nende Elemente, die keine Flexion aufweisen‘. Alleine schon die Tatsache, dass 
einigen Modaladverbien gelegentlich auch eine abtönende Wirkung zugeschrie- 
ben werden kann, zeigt aber, dass eine solche Definition nicht ausreicht, um das 
Wesen der Modalpartikeln zu beschreiben. 

Alle Merkmale auszulassen, die nicht auf alle Modalpartikelbelege zutreffen, 
führt also nicht zum gewünschten Ergebnis. Allerdings wäre das im Rahmen ei- 
ner Prototypenanalyse auch nicht notwendig, da die oben angeführten Merkmale 
tatsächlich alle auf die Mehrzahl der Partikeln bzw. der Partikelbelege zutreffen. 
Auch wenn sie vielfach nicht als absolute Abgrenzungskriterien der Kategorie 
‚Modalpartikel‘ gelten können, so liefern sie doch ein gutes Bild des Wesens einer 
Modalpartikel und können also für die Beschreibung des Prototyps dieser Kate- 
gorie herangezogen werden. Es ist mithin an dieser Stelle nicht notwendig, neue 


dem Begriff ‚prototypikalisch‘ wird auf die Struktur der Kategorie verwiesen, während die ein- 
zelnen Elemente als ‚prototypische‘ (oder eben ‚unprototypische‘) Mitglieder der Kategorie ein- 
gestuft werden. 

19 Meines Wissens wird nur in den jüngeren Arbeiten von Braber/McLelland (2010) und Lang 
(2012) die Kategorie der Modalpartikeln als prototypikalisch eingestuft. Heringer (1988) zieht 
zwar auch die Prototypenlehre heran, allerdings mehr zur Bestimmung der Bedeutungsvielfalt 
einzelner Partikeln als zur Beschreibung der Modalpartikelkategorie als Ganzes. 
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Abgrenzungskriterien zu bestimmen: Die etablierten Merkmale können erhalten 
bleiben, aber eben nur als prototypikalisch. 

An dieser Stelle sei angemerkt, dass Prototypizität sowohl auf der Ebene der 
Typen (Lexeme) als auch auf der Ebene der Tokens (Einzelbelege) eine Rolle 
spielt. Belege, die alle typischen Merkmale der Modalpartikeln aufweisen, sind 
prototypischere Instanziierungen der Kategorie ‚Modalpartikel‘ als solche, die 
zum Teil von diesem Muster abweichen. Man vergleiche etwa Beispiel (2), das 
hier als Beispiel (11a) wiederaufgegriffen wird, mit der konstruierten Variante 
(11b), die eine prototypischere Verwendung von halt enthält. 


(11a) Jaich meine, wir sind verwandt halt! 


(11b) Jaich meine, wir sind halt verwandt! 


Wie diese Beispiele zeigen, sind nicht unbedingt alle Belege einer Partikel 
gleich prototypische Modalpartikelbelege. Diese Distribution der Einzelbelege ist 
auch ausschlaggebend für die Frage, inwiefern ein Typ als prototypisches Mit- 
glied der Kategorie ‚Modalpartikel‘ gelten kann: Je mehr Tokens eines Typs pro- 
totypische Instanziierungen einer Kategorie sind, umso prototypischer ist der 
Typ als Mitglied dieser Kategorie. Halt ist zum Beispiel eine ziemlich prototypi- 
sche Modalpartikel, weil die meisten Belege der Partikel als prototypische Instan- 
ziierungen dieser Kategorie gelten können: Abweichungen vom Prototyp gibt es 
nur auf der Ebene des Stellungsverhaltens, und zudem nur selten ((11a) ist der 
einzige Beleg in dieser Hinsicht in meinen Korpusdaten). Bloß dagegen ist eine 
etwas weniger prototypische Modalpartikel: Wie oben angedeutet, kann es be- 
tont werden, und zudem kann es in Ergänzungsfragen (ähnlich wie nur in Bei- 
spiel (4)) im Vorfeld eingesetzt werden. In vielen Fällen weist bloß zwar alle Merk- 
male des Prototyps der Modalpartikelkategorie auf, aber da die Abweichungen 
vom Prototyp doch zahlreicher zu sein scheinen als bei halt, gilt bloß (als Typ) 
immerhin als ein etwas weniger prototypisches Mitglied der Kategorie ‚Modalpar- 
tikel‘ als halt. 

Trotzdem weist auch und gerade halt also nicht immer alle Merkmale des 
Prototyps auf. Dies ist auffällig, da halt von Thurmair (1989) als die prototypische 
Modalpartikel schlechthin bezeichnet wird. Aus dieser Beobachtung hat Imo 
(2008: 150) den Schluss gezogen, die Kategorie ‚Modalpartikel‘ sei „als Abstrak- 
tion auf einen imaginären Idealzustand hin zu sehen“, die die einzelnen Parti- 
keln im Laufe ihrer Grammatikalisierung noch nicht erreicht hätten. Aus dieser 
Sicht würde der Prototyp nur von einzelnen Belegen, nicht jedoch von irgendei- 
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nem Lexem realisiert: Die Typen kreisten aufgrund der wittgensteinschen Fami- 
lienähnlichkeiten in unterschiedlich weiten Bahnen um den Prototyp herum, 
aber kein einziger stünde wirklich als Prototyp im Zentrum. 

Der Hauptgrund für die Tatsache, dass so viel Variation bzw. so viele Abwei- 
chungen vom prototypischen Muster nachzuweisen sind, wurde von Imo 
(a. a. O.) zu Recht in der Grammatikalisierung gesucht. Auch wenn diachrone 
Analysen zu den Partikeln (Abraham 1990, Wauchope 1991 u. v. a.) gezeigt ha- 
ben, dass sich die ältesten deutschen Modalpartikeln schon in der Phase des Alt- 
hochdeutschen entwickelt haben, handelt es sich im Allgemeinen doch um eine 
eher junge Kategorie, die sich vor allem in neueren Zeiten entfaltet hat (vgl. 
Molnär 2002: 23) und sich immer noch weiter entwickelt. Es hat sich zwar ein Pro- 
totyp herausgebildet, der als Ziel dieses Grammatikalisierungsprozesses fun- 
giert, aber viele Partikeln haben dieses Ziel noch nicht gänzlich erreicht, und ge- 
rade das erklärt die vielen Abweichungen vom Prototyp (vgl. auch Diewald 2013: 
28 und Schoonjans 2013: 143). 

Festzuhalten bleibt also, dass es sich bei der Kategorie ‚Modalpartikeln‘ um 
eine prototypikalisch aufgebaute Kategorie handelt, deren Prototyp sich anhand 
der traditionellen, im Abschnitt 2.1.2 angeführten Merkmale bestimmen lässt. Al- 
lerdings lassen sich einzelne Partikelbelege finden, die von diesem prototypi- 
schen Muster abweichen, und dementsprechend sind auch nicht alle Partikelle- 
xeme bzw. Typen als gleich prototypische Mitglieder der Kategorie einzustufen. 
Diese These ist für die folgende Analyse in dreierlei Hinsicht relevant: Erstens er- 
laubt sie es, mit unprototypischen Belegen der analysierten Partikeln umzuge- 
hen, zweitens erlaubt sie es, Elemente wie einfach und eigentlich, deren Einstu- 
fung als Modalpartikeln bislang nicht ganz unkontrovers war, durchaus mit zur 
Partikelgruppe zu zählen, die als Ausgangspunkt für die Analyse gilt, und drit- 
tens erlaubt sie eine interessante Reflexion über die (in einem Prototypenansatz 
sowieso verschwommenen) Grenzen der Kategorie auf extensionaler Ebene im 
Hinblick auf andere Elemente, die ebenfalls mit den weiter unten noch anzuspre- 
chenden Gesten korrelieren können. Tatsächlich wird bei einigen Gesten zu be- 
sprechen sein, inwiefern sie auch mit anderen verbalen Elementen korrelieren 
können. Dabei dürfte es sich um weitere etablierte Modalpartikeln handeln, aber 
ebenso um Elemente, die zwar herkömmlicherweise nicht als Modalpartikeln ein- 
gestuft werden, diesen aber sowohl von der Bedeutung her als auch auf formaler 
Ebene ziemlich nahe stehen und dementsprechend als unprototypische Modal- 
partikeln betrachtet werden könnten. In dieser Hinsicht könnte also die Gesten- 
analyse ein neues Licht auf die Kategorie ‚Modalpartikeln‘ werfen, sowohl, was 
den Kernbereich betrifft, als auch im Hinblick auf die Grenzregion. Diese Frage 
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soll im weiteren Verlauf dieser Arbeit, und insbesondere im Rahmen der konkre- 
ten Fallstudien in den Kapiteln 7-9, noch weiter behandelt werden. Dass trotzdem 
die hauptsächlich formal definierte Kategorie ‚Modalpartikeln‘ als Ausgangs- 
punkt für die vorliegende Studie gewählt wurde und nicht die funktional defi- 
nierte Kategorie ‚Abtönungsformen‘, die diese anderen zu erwähnenden Ele- 
mente mit einschließen würde, liegt vor allem daran, dass letztere Kategorie als 
Ausgangspunkt zu breit wäre und dann ohnehin auf einige beispielhafte Formen 
zu reduzieren wäre. Deswegen wurde die Entscheidung getroffen, den Zugang zu 
den Daten über die Modalpartikeln als die typischeren und bereits ausführlicher 
untersuchten Abtönungsformen des Deutschen zu wählen. 


2.3 Die analysierten Partikelcluster 


Im Rahmen dieser Analyse wird drei onomasiologisch (d. h. aufgrund der Bedeu- 
tung) definierten Clustern von Modalpartikeln besondere Aufmerksamkeit ge- 
widmet. Diese Cluster werden im Folgenden eingehender vorgestellt. Es handelt 
sich erstens um Partikeln wie denn und eigentlich, die eine Frage in den Ge- 
sprächskontext einbinden (Cluster 1, Abschnitt 2.3.1), zweitens um Partikeln wie 
ja und doch, die einen Sachverhalt als bekannt oder wahr markieren (Cluster 2a, 
Abschnitt 2.3.2), und drittens um Partikeln wie eben, einfach und halt, die einen 
Sachverhalt als evident darstellen (Cluster 2b, Abschnitt 2.3.3). 


2.3.1 Cluster 1: denn & eigentlich 


Der erste Cluster enthält Partikeln, die eine Frage mit dem Kontext verknüpfen 
bzw. in den Gesprächszusammenhang einbinden. Dies ist eine ziemlich allge- 
meine Funktion, die wenig über die genaue Nuance der Partikeln aussagt, und 
dementsprechend ist dieser Cluster in dieser Hinsicht etwas heterogener als die 
beiden anderen. Als zentrale Elemente für die Analyse gelten die Partikeln denn 
und eigentlich. 

Denn zählt zu den häufigeren Modalpartikeln des Deutschen und gilt als die 
meistverwendete Partikel in Fragen (s. u. a. Hentschel 1986: 247). Damit wurde 
gleich auch der Verwendungsbereich dieser Partikel angedeutet: denn wird nur 
in Fragen eingesetzt.” Dabei kann es sich sowohl um Entscheidungsfragen (12) 


20 Die Verwendung in Kombinationen wie denn auch und denn doch sowie in Konditionalsätzen 
mit wenn bleibt in der vorliegenden Arbeit außer Betracht, zum einen, weil die Einstufung von 
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als auch um Ergänzungsfragen (13) handeln, wenngleich denn Péteri (2011: 104) 
zufolge besonders in Ergänzungsfragen hochfrequent ist (vgl. auch Thurmair 
1989: 169). 


(12) Jo: Willst du morgen mitkommen zum Baden? 
Mia: Hast du denn zur Zeit Urlaub? 
(Thurmair 1989: 164) 


(13) Was ist denn hier passiert? Hier riechts so komisch. 
(Thurmair 1989: 166) 


Diese Beobachtungen sehen sich auch im für die vorliegende Arbeit verwen- 
deten Korpus bestätigt: Denn ist tatsächlich die häufigste Partikel in Fragen, und 
wird vor allem in Ergänzungsfragen eingesetzt (87,64% bzw. 78 von 89 Belegen 
gegen 12,36% in Entscheidungsfragen). Bei letzterer Anmerkung stellt sich aller- 
dings die Frage, inwiefern es sich um eine typische Eigenschaft von denn handelt. 
Jedenfalls zeigen die Korpusdaten, dass auch eigentlich häufiger in Ergänzungs- 
fragen eingesetzt wird (22 von 26 Belegen, d. h. 84,62%). Es scheint sich also nicht 
um eine typische Eigenschaft von denn zu handeln, sondern vielmehr um eine 
allgemeinere Tendenz, der auch andere Modalpartikeln unterliegen.” 

Wichtiger im Rahmen der vorliegenden Arbeit ist allerdings die Funktion der 
Partikel. Diachrone Studien zu denn (von Stuckrad 1957, Wegener 2002) besagen, 
dass sich diese Partikel aus der Verwendung als Konsekutivadverb (heutzutage 
standardsprachlich meist dann, regional aber auch noch denn) entwickelt hat.” 


denn als Modalpartikel in diesen Fällen kontrovers ist, zum anderen aber auch, weil diese Ver- 
wendungsform in meinem Korpus nicht belegt ist. 

21 Für diese Zählung wurden alle Partikelbelege im Korpus verwendet, d. h. auch diejenigen, 
bei denen der Sprecher nicht zu sehen ist und die mithin für die eigentliche Analyse außer Be- 
tracht bleiben. Zu beachten ist, dass die Ergänzungsfragen im Allgemeinen im Korpus etwas 
zahlreicher sind als die Entscheidungsfragen, allerdings nicht in dem Maße, dass sich die Distri- 
bution der Partikeln alleine dadurch erklären ließe (503 Ergänzungsfragen gegenüber 296 Ent- 
scheidungsfragen, d. h. 62,95%-37,05%). Der Hang der Partikeln zu den Ergänzungsfragen ist 
signifikant: X?=20,498, p<0,001 im Falle von denn und x?=4,213, p<0,05 im Falle von eigentlich. 
22 Molnärs (2002) alternative Theorie, die Modalpartikel denn habe sich aus der Verwendung 
als Konjunktion entwickelt, halte ich für weniger wahrscheinlich, da sie zum einen mit der hier 
dargelegten Bedeutungsbeziehung zwischen Modalpartikel und Adverb (die sich auch darin 
zeigt, dass denn manchmal ambig ist zwischen der Verwendung als Modalpartikel und als Ad- 
verb, vgl. auch Schoonjans/Feyaerts 2010: 75) weniger verträglich ist und zum anderen eine eher 
seltsame topologische Diskrepanz enthielte (das Adverb steht - zumindest in Fragen - genauso 
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Als Konsekutivadverb markiert denn (bzw. dann), dass ein Sachverhalt Y als 
Folge eines anderen Sachverhalts X zu betrachten ist (vgl. wenn X, dann Y). Bei 
der Modalpartikel liegt eine ähnliche Folgebeziehung vor, allerdings auf meta- 
sprachlicher Ebene: Mittels der Partikel denn wird markiert, dass der Anlass für 
die Frage im Gesprächskontext zu finden ist. Vielfach handelt es sich um etwas 
Unerwartetes, das beim Sprecher ein gewisses Staunen hervorruft, obwohl diese 
Nuance nicht immer gleich prominent anwesend ist (vgl. Thurmair 1989: 164-167 
und 1991a: 384-385 sowie Deppermann 2009: 51). 

Das Element der Kommunikationssituation, das den Sprecher zu der Frage 
mit denn veranlasst, ist vielfach im verbalen Kontext zu situieren. Typischerweise 
handelt es sich in dem Fall um eine Vorgängeräußerung des Gesprächspartners, 
wie in (12). Wenn Jo fragt, ob Mia mit ihm baden gehen möchte, so impliziert das, 
dass er Zeit dafür hat. Das findet Mia seltsam, da es sich im Grunde genommen 
um einen Arbeitstag handelt, und dementsprechend fragt sie ihn, ob er denn Ur- 
laub hat. Der Anlass für diese Frage ist also Jos Bitte, ihn zum Baden zu begleiten, 
und diese Beziehung zur Vorgängeräußerung wird durch denn markiert. Ähnlich 
ist die Situation in (13). Allerdings ist der Anlass für die Frage hier nicht eine Vor- 
sängeräußerung, sondern ein außersprachliches Element der Gesprächssitua- 
tion, das der Sprecher gerade wahrnimmt. In diesem Fall bemerkt der Sprecher, 
dass ein komischer Geruch im Raum hängt, und aus dem Grund stellt er die 
Frage, was passiert sein könnte. 

Ähnlich wie die Erstaunensnuance ist jedoch auch diese Veranlassungsbe- 
ziehung nicht immer gleich deutlich wahrnehmbar. In (14-15) zum Beispiel ist es 
zwar so, dass die Frage gut in den Kontext hineinpasst, aber trotzdem ist es 
schwieriger zu sagen, die Frage sei von einem Element in der Gesprächssituation 
hervorgerufen worden, als in (12-13). Aus diesem Grund haben Thurmair (1989: 
167), Péteri (2011) und Bayer (2012) angedeutet, dass sich denn zu einem reinen 
Frageanzeiger, ähnlich dem lateinischen Fragesuffix -ne, weiterentwickeln 
dürfte.” Die eigentliche abtönende (bzw. (inter)subjektive) Funktion scheint also 


wie die Modalpartikel typischerweise im Mittelfeld, während die Konjunktion nicht mittelfeldfä- 
hig ist). 

23 Meibauer (1994: 222) lehnt diese Analyse ab, weil u. a. die Verwendung in Konditionalsätzen 
wie wenn es denn sein muss dagegen spräche. Allerdings handelt es sich hier um eine andere 
Verwendung von denn, die einem anderen Zweig der Grammatikalisierung dieser Form angehö- 
ren dürfte. Zudem ist es typisch für Grammatikalisierungsprozesse, dass ältere Stufen der Ent- 
wicklung neben den neueren weiterbestehen. Selbst wenn man davon ausgeht, dass denn in 
Konditionalsätzen und in Fragen auf einer Grammatikalisierungslinie stehen, wäre also das Be- 
stehen dieser Form in wenn-Sätzen nicht als Argument gegen eine weitere Grammatikalisierung 
hin zum Frageanzeiger zu sehen. 
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zurückzutreten zugunsten der illokutionstypmarkierenden Wirkung, die der pro- 
minenteste Aspekt der Bedeutung von denn zu werden scheint. 


(14) IN: Also das merkt man halt: Der gelernte Koch kennt alle Tricks, ne. 
HO: Ja, das ist von Mama geklaut, ne. Also wie lernt man das denn alles? 
Man guckt sich ja überall alles ab. 
(FG_Blc) 


(15) Ei, hallo Ulli! Wie gehts denn so? 
(Thurmair 1989: 169) 


In der Hinsicht ähnelt die Partikel denn der Partikel eigentlich. Diese Partikel, 
die ebenfalls in Entscheidungs- wie Ergänzungsfragen vorkommt, hat zwar bis- 
lang nicht diese Weiterentwicklung zum reinen Frageanzeiger angetreten, ist je- 
doch weniger deutlich abtönend (im engsten Sinne des Wortes) als die anderen 
Partikeln, die in der vorliegenden Arbeit eingehender betrachtet werden: Eigent- 
lich wird eingesetzt, um den Übergang zu einem anderen Thema (bzw. zu einem 
anderen Aspekt des Themas) zu markieren. Die Einstufung als weniger deutlich 
abtönend impliziert allerdings nicht, dass die Partikel keine intersubjektive Wir- 
kung hätte. Indem er eigentlich einsetzt, markiert der Sprecher explizit, dass er 
durchaus einsieht, dass die Frage einigermaßen vom Gesprächszusammenhang 
gelöst ist. Mittels eigentlich weist der Sprecher also explizit auf diesen Themen- 
wechsel hin, sodass der Hörer auch darauf aufmerksam gemacht wird und die 
Frage nicht als einen Bruch im logischen und kohärenten Gesprächsaufbau auf- 
fasst. 

Die Beispiele (16-17) illustrieren die Verwendung von eigentlich. In Beispiel 
(16), das dem Korpus Verbmobil des Bayerischen Archivs für Sprachsignale ent- 
stammt, wird eigentlich in einer Entscheidungsfrage verwendet, mit der auf the- 
matischer Ebene von der Anfangszeit zur Dauer der Besprechung übergegangen 
wird. In (17) steht eigentlich in einer Ergänzungsfrage. Das Beispiel entstammt ei- 
ner Sendung von Volle Kanne (ZDF). In jeder Sendung bereitet Fernsehkoch Ar- 
min Roßmeier ein einfaches Gericht zu. Das Beispiel folgt direkt danach: Der Mo- 
derator dankt dem Koch und wendet sich wieder dem Studiogast Horst Lichter 
zu. Im Großen und Ganzen scheint auch hier das Rahmenthema gleichzubleiben 
(Essen), aber es liegt durchaus eine thematische Verschiebung vor (vom Tages- 
gericht zum Lieblingsgericht des Gastes). 


(16) MOR: Ja, dann sagen wir doch einfach Dienstag, zehn Uhr, zu unserem 
Besprechungstermin. Wären Sie da einverstanden? 
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CWI: Ja. Wissen Sie eigentlich, wie lange der Besprechungstermin unge- 
fähr ähm dauern wird? 
(Verbmobil m30n) 


(17) IN: Danke, Armin, das sieht doch sehr sehr lecker aus. Horst, was ist ei- 
gentlich dein Lieblingsgericht? 
(FG_Bic) 


Gelegentlich wird angenommen, dass eigentlich die Frage als beiläufig mar- 
kiert oder wenigstens markieren kann (u. a. Péteri 1992: 23 und Weydt/Hentschel 
1983: 11). Thurmair (1989: 177) ist damit nicht einverstanden und behauptet dies- 
bezüglich: „Eigentlich-Fragen leiten ein neues Thema ein, das dann aber auch 
Thema bleibt.“ Die Wahrheit liegt vermutlich in der Mitte. Normalerweise wird 
auf Fragen mit eigentlich eine Antwort erwartet, und wenigstens so lange bleibt 
das neue Thema tatsächlich erhalten. Man kann auch länger beim neuen Thema 
verweilen (in (17) wird zum Beispiel noch einige Minuten lang über Horst Lichters 
Lieblingsessen weitergeredet), aber dem ist nicht unbedingt so. Nachdem die 
Frage in (16) geäußert wurde, zum Beispiel, wird kurz eine Antwort geliefert, und 
schon gleich wird mit der Einplanung eines weiteren Termins fortgefahren. Wirk- 
lich beiläufig ist die Frage in (16) vielleicht nicht - es ist für die Einplanung der 
Besprechung durchaus wichtig, zu wissen, wie lange sie dauern soll - aber dieser 
Aspekt der Dauer bleibt nur ganz kurz das Thema. Ähnlich ist es, wenn man Es- 
sensgäste zwischendurch fragt: „Werden Sie eigentlich satt?“ Solche Fragen wer- 
den meist nur ganz kurz beantwortet, und schon gleich danach kehrt man zum 
vorigen Gesprächsthema zurück oder man wechselt abermals zu einem neuen 
Thema. In solchen Fällen scheint die Frage also doch, contra Thurmair (a. a. O.), 
eher als beiläufig einzustufen zu sein. 


2.3.2 Cluster 2a: ja & doch 


Der zweite Cluster hat als zentrale Elemente zwei Partikeln, die typischerweise in 
Assertionen eingesetzt werden: ja und doch. Diese zwei Partikeln haben gemein- 
sam, dass sie einen Sachverhalt als bekannt oder wahr markieren. Im Fall von 
doch kommt noch eine Adversativitätsnuance hinzu, auf die weiter unten einge- 
gangen werden soll. 

Darüber, wie man die Bedeutung von ja am besten umschreiben kann, be- 
steht in der Literatur bislang kein Einverständnis (vgl. Rinas 2007a und Hoff- 
mann 2008). Thurmair (1989) liefert einen vielfach herangezogenen Ansatz, in 


Die analysierten Partikelcluster —— 37 


dem sie behauptet, die Partikel ja markiere den Sachverhalt als einen, der dem 
Hörer bekannt sein dürfte. Dies illustriert Beispiel (18), das einer Plenarrede von 
Wolfgang Schüssel im Österreichischen Parlament entstammt: Wenn er die Aus- 
sage ‚jedes Dokument ist transparent im Internet abrufbar‘ mit ja abtönt, signali- 
siert er, dass er davon ausgeht, dass seine Gesprächspartner (bzw. in diesem Fall 
seine Zuhörer im Parlament) das eigentlich bereits wissen dürften bzw. sollten. 


(18) WS: Es sind die Bürger insofern gestärkt, weil ja jedes Dokument trans- 
parent im Internet abrufbar ist. 
(PR_Schü0811) 


Allerdings kann nicht immer einfach von einer objektiven Bekanntheit des 
Sachverhalts ausgegangen werden, wie auch Thurmair (1989: 106) selber schon 
angemerkt hat. Wie Beispiel (19) zeigt, kann der Sprecher dies bewusst als rheto- 
rische Strategie einsetzen, um eine ironische Wirkung zu erzeugen oder um Wi- 
derspruch vonseiten des Hörers zu vermeiden. Die Bekanntheit wird hier mehr 
oder weniger ‚auferlegt‘, d.h. die Vertrautheit mit der Information wird in den 
Hörer hineinprojiziert, was Reiter (1985) als die „Perfidie“ von ja bezeichnet. So- 
fern die Partikel nicht ironisch gemeint ist, ist die Absicht hinter dieser Verwen- 
dung von ja, dass sich der Hörer denkt, dieser ihm unbekannte Sachverhalt sollte 
ihm eigentlich bekannt sein, und er solle deshalb lieber keine Einwände äußern. 
Allerdings zeigen Beispiele wie (20), dass ja auch eingesetzt werden kann, wenn 
dem Hörer der Sachverhalt gewiss noch nicht bekannt war, ohne dass die Ver- 
wendung von ja als wirklich perfide zu betrachten wäre. 


(19) Chomsky hat dieses Problem in seinen ‚Aspects‘ behandelt, die Sie ja 
alle gelesen haben, so dass ich nicht näher darauf einzugehen brauche. 
(Bublitz/von Roncador 1975: 145) 


(20) Würden Sie bitte weiter durchgehen! - Nein, ich muss ja nächste Station 
schon aussteigen! 
(Rinas 2007a: 205) 


Eine ähnlich problematische Situation stellt sich auch im für die vorliegende 
Arbeit verwendeten Korpus, das u. a. im Fernsehen übertragene Sportberichte 
enthält (siehe Kapitel 5 für genauere Informationen). Als Beispiel könnte (21) her- 
angezogen werden. Die Rede ist vom Start des gerade beendeten Massenstart- 
rennens (eine Art von Rennen im Biathlon, bei dem alle Athleten gemeinsam los- 


38 — Modalpartikeln 


laufen), und während der Reporter die Äußerung in (21) realisiert, werden die Bil- 
der dieses Starts nochmals eingeblendet. Dass Kati Wilhelm das erste Massen- 
startrennen der Saison gewonnen hat, dürfte den Biathlonadepten bekannt sein. 
Es ist aber nicht auszuschließen, dass zufälligerweise auch andere Leute zu- 
schauen, die sich gar nicht mit Biathlon auskennen und dies also gar nicht wis- 
sen. Allerdings stellt sich in diesem Fall die Frage, inwiefern sich der Sprecher 
dessen bewusst ist. Zudem könnte hier auch ein gewisses Hineinprojizieren der 
Bekanntheit in den Hörer stattfinden: ‚Die Information dürfte bekannt sein, und 
falls sie es nicht ist, so wird sie hiermit der gemeinsamen Wissensbasis hinzuge- 
fügt und kann dementsprechend wie bekannte Information behandelt werden.‘ 


(21) CH: Da haben wir nochmal den Blitzstart von Kati Wilhelm, im roten Tri- 
kot - sie hat ja den ersten Massenstart des Jahres gewonnen. 
(FG_Ala) 


Auf solche Fälle geht auch Reineke (2016) ein. Sie betrachtet die Modalparti- 
kel ja generell als ein Mittel der Wissenszuschreibung und behauptet, ihre Ver- 
wendung könne in solchen Fällen „auch face-schützend für die Teilnehmer sein“ 
(Reineke 2016: 98): Der Sprecher könne nicht einfach davon ausgehen, dass der 
Sachverhalt dem Hörer bereits bekannt sei, und müsse ihn deswegen erwähnen. 
Falls aber der Hörer doch bereits über dieses Wissen verfügen sollte, sei es ge- 
sichtsbedrohend, es in unmodalisierter Form zu vermitteln, denn dies könnte so 
verstanden werden, als unterschätze man den Wissensstand des Hörers und gehe 
davon aus, dass er Bekanntes nicht wisse. Dementsprechend werde die Partikel 
ja als eine Strategie der Gesichtswahrung eingesetzt, „um auf ein Ereignis zu ver- 
weisen, das der Adressatin möglicherweise, aber nicht zwingend bekannt ist“ 
(Reineke 2016: 95). 

Alternativ formuliert Rinas (2007a) aufgrund solcher Fälle, in denen höchs- 
tens von hineinprojizierter Bekanntheit ausgegangen werden könnte, den Vor- 
schlag, der Partikel ja nicht eine Bekanntheitsbedeutung zuzuschreiben, son- 
dern vielmehr davon auszugehen, dass diese Partikel Wahrheit markiere. 
Wichtig ist allerdings, dass ‚Wahrheit‘ hier nicht im kategorischen logisch-philo- 
sophischen Sinne zu interpretieren ist; vielmehr ist gemeint, dass der Sprecher 
mit der Partikel ja zu verstehen gibt, dass er keinen Widerspruch vonseiten des 
Hörers erwartet. Ähnliche Darstellungen finden sich auch bei Lindner (1991) und 
Modicom (2012) sowie bei Hoffmann (2008: 212), dem zufolge ja den Sachverhalt 
als „aus Sprechersicht gewiss geltend“ markiere und diese Gewissheit als eine 
„hörerseitig zu übernehmende“ zu interpretieren sei, bei Brünjes (2014: 144), die 
von „Übereinstimmung von Sprecher und Hörer in Bezug auf die Proposition“ 
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spricht, und bei Reineke (2016: 89-90), die neben „bekannt“ zur Beschreibung 
der Bedeutung von ja auch „fraglos (‚evident‘)“ vorschlägt und damit meint, 
„dass das Zutreffen des jeweiligen Sachverhaltes als fraglos dargestellt wird“. Die 
Wahrheitsfacette ist auch der Bedeutungsaspekt, der in bis auf das Althochdeut- 
sche zurückgehenden diachronen Analysen von ja (Hentschel 1986, Wauchope 
1991) als der wichtigste genannt wird. Zwar geben Hentschel und Wauchope auch 
an, dass es sich typischerweise um einen Sachverhalt handelt, der dem Hörer be- 
kannt sein dürfte, aber eine unabdingbare Voraussetzung für die Verwendung 
von ja scheint dies nicht zu sein. 

Wie dem auch sei, der Begriff ‚Wahrheit‘ dürfte aufgrund seiner logisch-phi- 
losophischen Beladenheit eine zu starke Bezeichnung sein, was sich auch darin 
zeigt, dass Rinas (a. a. O.) selber die Paraphrase des Keinen-Widerspruch-Erwar- 
tens anführt. Diese Paraphrase ist jedoch mit einer spezifischen Auslegung des 
Wahrheitsbegriffs zu verknüpfen, die eher mit dem Begriff des Einverständnisses 
im Einklang zu sein scheint. Allerdings ist auch hier darauf hinzuweisen, dass 
der Begriff intersubjektiv zu interpretieren ist: Der Sprecher zeigt durch die Ver- 
wendung von ja kein Einverständnis mit dem Hörer, sondern projiziert (intersub- 
jektiv) Einverständnis mit der eigenen Aussage in den Hörer hinein bzw. gibt an, 
dass der Hörer mit der Aussage einverstanden sein dürfte bzw. sollte (vgl. auch 
Hoffmanns (a. a. O.) „hörerseitig zu übernehmende Gewissheit“). Gleichwohl ist 
auch diese Analyse der Bedeutung von ja nicht unproblematisch. Tatsächlich 
kann man sich bei subjektiven Äußerungen wie (22-24) fragen, inwiefern der Hö- 
rer überhaupt damit ‚einverstanden‘ sein könnte bzw. inwiefern ihnen überhaupt 
widersprochen werden kann. Der Hörer kann den Sachverhalt zur Kenntnis neh- 
men oder bestätigen, aber damit wirklich einverstanden zu sein, ist schwierig. 
Ähnlich nehmen Fernsehzuschauer als Hörer eine Sonderstellung ein, indem sie 
im Allgemeinen nicht direkt reagieren können und somit dem Sprecher nicht di- 
rekt widersprechen können, sodass in diesen Fällen eine Interpretation von ja als 
Markierer des ‚Einverständnisses‘ auch als in gewissem Sinne perfide zu betrach- 
ten wäre (vgl. zu solchen Fällen auch Reineke 2016: 121). 


(22) Und Fonds war ich ja immer schon dagegen. 
(FG_Blc) 


(23) Ich fühle mich ja hier wie zuhause. 
(COSMAS-II, Teilkorpus nkz) 


(24) Orange ist ja meine Lieblingsfarbe. 
(http: //www.polar-chat.de/topic_88038_490.html, Zugriff 12.03.2014) 
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Hier zeigt sich also nochmals deutlich, wie stark die Partikelbedeutung vom 
Kontext abhängig ist. Einen Begriff zu finden, der ohne Weiteres auf alle Verwen- 
dungen von ja als Modalpartikel anwendbar wäre, stellt sich als besonders 
schwierig heraus. Mangels einer besseren Bezeichnung sollen im weiteren Ver- 
lauf dieser Arbeit die oben angesprochenen Begriffe weiter verwendet werden, 
allerdings immer im Hinterkopf behaltend, dass keiner dieser Begriffe die Wir- 
kung von ja völlig abdeckt. 

An dieser Stelle sollen noch zwei typische Verwendungskontexte angespro- 
chen werden, von denen behauptet worden ist, dass eine separate Variante von 
ja vorliege: die Verwendung in Ausrufen und in Begründungen. In Ausrufen 
(bzw. emphatischen Aussagen) wird der Partikel ja u. a. von Thurmair (1989: 107) 
die Funktion zugeschrieben, Überraschung über das Zutreffen des Sachverhalts 
zu markieren. Daher auch umschreibt sie diese Verwendung von ja als ‚Überra- 
schungs-ja‘. 


(25) Du blutest ja! 
(Thurmair 1989: 107) 


Allerdings kann die Unterscheidung zwischen einfachen und emphatischen 
Aussagen nicht immer eindeutig getroffen werden, und ähnlich schwierig ist die 
Abgrenzung des Überraschungs-ja vom Bekanntheits-ja. Tatsächlich gesteht 
schon Thurmair selber ein (a. a. O.), dass sich die beiden Varianten von ja inso- 
fern ähneln, als der Sachverhalt auch im Falle des Überraschungs-ja dem Hörer 
schon bekannt sein dürfte. Es ließe sich jedoch - ähnlich wie beim Bekanntheits- 
ja - fragen, ob das immer so ist. Waltereit (2006: 42) behauptet gar, das Überra- 
schungs-ja werde nur verwendet, wenn der Sachverhalt dem Hörer gerade noch 
nicht bekannt ist. Auch diese Stellungnahme ist jedoch problematisch, da der 
Hörer das Gesagte manchmal sehr wohl wissen dürfte.” In dieser Hinsicht scheint 
sich dieses Überraschungs-ja nicht wesentlich von der oben besprochenen Ver- 
wendung von ja zu unterscheiden, sodass mit Rinas (2007a: 210) festgehalten 
werden kann, dass hier keine separate Variante von ja anzunehmen ist: Vielleicht 


24 Gegebenenfalls könnte man noch annehmen, dass ja hier andeute, der Sprecher gehe davon 
aus, dass der Hörer es nicht wisse, und projiziere also Unbekanntheit der Information in den 
Hörer hinein. Allerdings ist in Fällen wie (i) die Chance, dass dem Hörer der Sachverhalt noch 
nicht bekannt war, als eher gering einzuschätzen, sodass auch diese Analyse nicht völlig un- 
problematisch ist. 


(i) GK: Du hast ja Wimperntusche! 
(FG_AFvid1) 
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ist der Sachverhalt dem Hörer bereits bekannt, vielleicht auch nicht, aber auf je- 
den Fall wird kein Widerspruch erwartet. 

Einen weiteren typischen Verwendungskontext der Partikel ja stellen be- 
gründende Äußerungen dar. Als Beispiel kann auf (21) zurückverwiesen werden, 
das hier als (26) nochmals aufgenommen ist. Als Hintergrund sei darauf hinge- 
wiesen, dass im Biathlonweltcup neben einer Gesamtwertung auch Einzelklasse- 
ments für die unterschiedlichen Subdisziplinen aufgestellt werden. Der Athlet, 
der die Wertung für die jeweilige Subdisziplin anführt, trägt ein rotes Trikot. In 
diesem Beispiel ist vom zweiten Massenstartrennen der Saison die Rede, und die 
Aussage, dass Kati Wilhelm im roten Trikot läuft, wird dadurch begründet, dass 
sie das erste Massenstartrennen des Jahres gewonnen hat und mithin die Welt- 
cupwertung in dieser Subdisziplin anführt. 


(26) CH: Da haben wir nochmal den Blitzstart von Kati Wilhelm, im roten Tri- 
kot - sie hat ja den ersten Massenstart des Jahres gewonnen. 
(FG_Ala) 


Auch in diesem Fall ist allerdings nicht klar, wie das genaue Verhältnis zum 
klassischen Bekanntheits-ja zu sehen ist. Forscher wie Rudolph (1986: 83) be- 
haupten, dass ja hier im Grunde genommen als Markierer einer kausalen Bezie- 
hung auftritt, indem die Äußerung mit ja den Grund für den Sachverhalt der Vor- 
gängeräußerung bzw. die Begründung für das Äußern dieser Vorgänger- 
äußerung liefert. Knetschke (1974) geht noch einen Schritt weiter und behauptet, 
ja sei in diesem Fall als reine kausale Konjunktion einzustufen. Neuerdings wird 
jedoch zunehmend (u. a. von Karagjosova 2003) die Ansicht vertreten, dass es 
sich bei der kausalen Bedeutung um eine Implikatur handle. Wie oben bereits 
dargelegt wurde, können Modalpartikeln zusätzlich zu ihrer eigentlich abtönen- 
den Bedeutung auch eine Beziehung zum Kontext markieren (was Thurmair 1989 
als <KONNEX> umschreibt). Aufgrund der Kernbedeutung von ja als Wahrheits- 
markierer wird dieser Konnexlink typischerweise als kausal oder begründend in- 
terpretiert, aber dies ist eine kontextuell bedingte Interpretation und nicht eine 
Konstante in der Bedeutung von ja (vgl. auch Rinas 2007a: 206). In der Hinsicht 
ist auch diese Verwendung von ja nicht wirklich vom Bekanntheits-ja zu unter- 
scheiden.” 


25 Als weitere Sonderverwendung könnte man das oben bereits kurz angesprochene betonte JA 
erwähnen, das in Aufforderungen zur Illokutionsverstärkung eingesetzt wird. Allerdings wäre 
dann zu klären, ob dieses JA als betonte Variante von ja zu betrachten ist (u. a. Meibauer 1993: 
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Festzuhalten bleibt also, dass ja an erster Stelle als Wahrheits- oder Bekannt- 
heitsmarkierer gelten kann. Dies trifft auch auf die Verwendung von doch in As- 
sertionen zu. Allerdings weist letztere Partikel zudem meist noch einen weiteren 
Bedeutungsaspekt auf, der sich als ‚Adversativität‘ umschreiben ließe. Dies zeigt 
sich zum Beispiel in (27), das einer österreichischen Parlamentsrede entstammt, 
in der der Oppositionsabgeordnete Josef Cap die undurchsichtige Vorgehens- 
weise des Kabinetts Schüssel II bei der Beschaffung neuer Kampfjets kritisiert. Er 
gibt an, dass es einfacher gewesen wäre, wenn sich die Regierung einfach die 
Frage gestellt hätte, was die Nation braucht (und eine entsprechende Typenent- 
scheidung gefällt hätte). Indem er die Partikel doch einsetzt, markiert Cap eine 
Einverständniserwartung im oben dargelegten Sinne. Zugleich aber, und darin 
liegt der Adversativitätsaspekt, signalisiert er, dass dieser als wahr geltende 
Sachverhalt mit der Vorgehensweise der Regierung nicht im Einklang ist: Obwohl 
die von Cap angesprochene Vorgehensweise bekanntlich die einfachere ist, hat 
die Regierung anders gehandelt. Wie Thurmair (1989: 112) angibt, geht mit dieser 
Adversativitätsnuance vielfach auch die Idee einer Korrektur einher: Der Spre- 
cher erwartet vom Hörer, dass dieser seine Annahmen oder Handlungen so an- 
passt, dass sie mit dem als wahr markierten Sachverhalt verträglich sind - ob- 
wohl das in diesem konkreten Fall (wenigstens auf der Ebene der Handlungen) 
schwierig sein dürfte, da sich Geschehenes vor allem bei solchen Geschäften viel- 
fach nicht ungeschehen machen lässt. 


(27) JC: Warum dieser komplizierte Weg? Warum haben Sie diese Leiden auf 
sich genommen? Es wäre doch einfacher gewesen, wenn Sie gesagt hät- 
ten: „Was braucht Österreich? Okay, das ist ein redimensioniertes Pro- 
fil.“ 

(PR_Cap3010) 


Ähnlich wie ja wird auch doch vielfach in begründenden Äußerungen einge- 
setzt. Erneut kann davon ausgegangen werden, dass es sich bei der Begrün- 
dungsbeziehung um eine konkrete Interpretation des <KONNEX>-Links handelt. In 
(28), zum Beispiel, das erneut einer Parlamentsrede entnommen wurde, wird mit 
der Äußerung „Dem war doch völlig Wurst, was zu untersuchen war“ die Aussage 
begründet, dass sich der Abgeordnete Cap schieflacht bei der Behauptung, sein 
Kollege Pilz habe im Rahmen eines Untersuchungsausschusses der Sache auf 


128), oder vielmehr als eine homophone aber separate Partikel (u. a. Coniglio 2007: 8). Diese Dis- 
kussion übersteigt jedoch die Reichweite der vorliegenden Arbeit, zumal das betonte JA im Kor- 
pus mit nur drei Belegen zu selten ist, um in die Analyse einbezogen zu werden. 
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den Grund gehen wollen. Hier ist zudem die Korrekturbedeutung deutlicher an- 
wesend: Wenn man weiß, dass Abgeordneter Pilz eigentlich gar nicht untersu- 
chen wollte, so soll man auch nicht behaupten, er hätte eine gründliche Untersu- 
chung beabsichtigt (impliziert ist bei der Äußerung Caps, dass dies tatsächlich 
von Pilz’ Parteikollegen behauptet wurde). 


(28) PW: Ich lach mich doch schief, wenn mir jemand erklären will, dass Ab- 
geordneter Pilz hier im Haus wirklich untersuchen wollte. Dem war doch 
völlig Wurst, was zu untersuchen war! 

(PR_Westenthaler2911) 


Allerdings ist die Adversativitätsnuance, die doch von ja unterscheidet, nicht 
immer gleich stark ausgeprägt. Zum Beispiel kann die Partikel doch auch einge- 
setzt werden, wenn Hintergrundwissen vermittelt wird, das für den weiteren Ver- 
lauf der Äußerung relevant ist (29). Auch hier handelt es sich im Allgemeinen um 
Information, die als wahr oder bekannt markiert wird, allerdings ohne deutliche 
Adversativität (höchstens wäre diese darin zu sehen, dass der Hörer die Informa- 
tion als für die Kommunikation relevanten Teil der gemeinsamen Wissensbasis 
parat halten sollte, während er das spontan vielleicht nicht gemacht hätte). Ähn- 
lich kann doch eine erinnernde Funktion haben. In dem Fall wird der Hörer mit 
der doch-Äußerung an etwas Bekanntes erinnert, das für den Gesprächsablauf 
relevant ist, aber ohne damit eine richtige Korrektur ansteuern zu wollen (30). 


(29) Da war doch neulich der schwere Unfall in unserer Straße. Und da hat 
sich jetzt ergeben, dass... 
(Hentschel 1986: 134) 


(30) A: Wo wollen wir denn hin zum Essen? 
B: Ach, ich hab’ ’ne Idee: Wir waren doch kürzlich mit Eva in der Kneipe 
da hinter dem Noordermarkt, da war doch nebenan so ein lustiges Res- 
taurant. Warum gehen wir da nicht hin? 
(Franck 1980: 183) 


Des Weiteren ist darauf hinzuweisen, dass der Äußerungstyp ‚Assertion‘ 
nicht nur den sogenannten emphatischen Aussagen ähnelt, die bei ja relevant 
waren, sondern auch den sogenannten Intonationsfragen. Dabei handelt es sich 
um Äußerungen, die von der Satzstruktur her eigentlich als Aussagesatz einzu- 
stufen wären, durch ihre Intonation (sowie im Schriftbild durch das abschlie- 
ßende Fragezeichen) jedoch als Bitte um Bestätigung interpretiert werden. Die 


44 —— Modalpartikeln 


Rolle der Partikel doch ist in diesem Fall, anzudeuten, dass eine zustimmende 
Antwort erwartet wird bzw. dass die vom Sprecher unterstellte Wahrheit des 
Sachverhalts vom Hörer bestätigt wird. In (31), zum Beispiel, das einer ARD-Talk- 
show entstammt, scheint der Sprecher (Reinhold Beckmann) sich daran zu erin- 
nern, dass die Schauspielerin Thekla Carola Wied einmal eine Nonne gespielt 
hat, ist sich aber offenbar nicht mehr ganz sicher und bittet sie um Bestätigung. 
Auch in dieser Verwendung von doch kann eine gewisse Adversativität vorliegen, 
wenngleich sie in (31) nicht so deutlich ist (dieser Fall wäre wieder eher als erin- 
nernd einzustufen). In (32) dagegen ist dieser Bedeutungsaspekt deutlicher an- 
wesend: Wenn es stimmt, dass es immer schon duftende Rosen gegeben hat (die 
Tatsache, für die um Bestätigung gebeten wird), so sollte sich Elmar (= EM) nicht 
darüber wundern, dass INs Rosen duften. Elmars Verhalten (das Erstaunen über 
die duftende Rose) ist also nicht im Einklang mit der bekannten (aber trotzdem 
hinterfragten) Tatsache, dass duftende Rosen nichts Neues sind. 


(31) RB: Sie haben doch mal ne Nonne gespielt, ja? 
(FG_B2a) 


(32) IN: Was ich klasse fand... Elmar kommt hier rein und sagt: „O, ne ganz 
tolle Rose! Die riecht!“ 
EM: Duftet, ne. Also Fische riechen, wenn sie lange liegen. 
IN: Nein, nein, aber... ähm... Rosen, die duften, die gab’s doch schon im- 
mer? 
(FG_Bic) 


Zum Schluss sei noch darauf hingewiesen, dass die Partikel doch im Gegen- 
satz zu ja ohne Betonungsunterschied auch in Aufforderungen eingesetzt werden 
kann.” Tatsächlich sind auch hier die Facetten der Wahrheit und der Adversati- 
vität zu unterscheiden. Die Wahrheit besteht darin, dass der Hörer bereits wissen 
dürfte bzw. wenigstens für wahr annehmen dürfte, dass er die in der Aufforde- 
rung angesprochene Handlung eigentlich schon hätte ausführen sollen; die Ad- 
versativitätsbedeutung ist darin zu sehen, dass der Hörer es trotzdem noch nicht 
gemacht hat. Im Allgemeinen werden Aufforderungen mit doch auch nicht als 
bloße Aufforderungen interpretiert; vielmehr handelt es sich um Ratschläge oder 


26 Die weiteren Verwendungen von doch in Ergänzungsfragen, Wünschen und W-Exklamatio- 
nen sind deutlich seltener und es liegen im Korpus zu wenige Belege vor, um sie in die Analyse 
einzubeziehen, sodass an dieser Stelle nicht weiter darauf eingegangen wird. 
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Einladungen (33), oder aber gerade um ungeduldig oder aufgeregt wirkende Vor- 
würfe, Warnungen oder Drohungen (34). Welche Nuance genau vermittelt wird, 
ist vom Kontext sowie von der Intonation abhängig. 


(29) Nehmen Sie doch noch ein bisschen Niere, meine Herren! 
(Thurmair 1989: 119) 


(30) Mutter zum Kind: Jetzt hör doch mit diesem Gejammere auf! Es gibt 
heute kein Eis. 
(Thurmair 1989: 119) 


2.3.3 Cluster 2b: eben, einfach & halt 


Zum Schluss dieses Kapitels sei noch kurz auf den dritten für die Analyse heran- 
gezogenen Partikelcluster eingegangen. Dieser Cluster wird als ‚Cluster 2b‘ be- 
zeichnet, weil eine gewisse Ähnlichkeit zu den Partikeln des Clusters 2a nachzu- 
weisen ist. Tatsächlich impliziert die für Cluster 2b grundlegende Bedeutung 
auch eine gewisse Wahrheitsmarkierung. Allerdings sind die Partikeln des Clus- 
ters 2b als etwas stärker zu betrachten, da sie den Sachverhalt nicht einfach als 
wahr markieren, sondern vielfach als evident, auf der Hand liegend, höchst plau- 
sibel u. dgl. 

Zentrale Elemente des Clusters 2b sind die Partikeln eben, einfach und halt. 
Über das genaue Verhältnis dieser Partikeln besteht allerdings noch keine Über- 
einstimmung in der Literatur. Die meisten Forscher scheinen jedoch davon aus- 
zugehen, dass zwischen eben und halt untereinander eine größere Ähnlichkeit 
nachzuweisen ist als zwischen diesen beiden Partikeln und einfach. Deshalb wird 
auch im Folgenden zunächst auf die beiden erstgenannten Partikeln eingegan- 
gen. 

Eben und halt werden - wie auch einfach - in Assertionen sowie in Aufforde- 
rungen verwendet. Ähnlich wie bei ja besteht auch hier kein Einverständnis dar- 
über, welcher Begriff die Leistung dieser Partikeln am besten wiedergibt. Wäh- 
rend Thurmair (1989) die oben angeführten Termini ‚Evidenz‘ und ‚Plausibilität‘ 
erwähnt, bezeichnen diese Partikeln Autenrieth (2002) zufolge den Sachverhalt 
als unabänderlich oder als die einzige Möglichkeit. Becker (1976) gibt an, dass 
eben auf das Nicht-Tolerieren von Gegenargumenten hindeute (halt erwähnt er 
nicht), und Burkhardt (1986) spricht von einem unumstößlichen und allgemein 
bekannten Sachverhalt. 
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Zum Teil dürfte diese Vielfalt an Begriffen auch auf die bereits angespro- 
chene Kontextsensitivität von Partikelbedeutungen zurückzuführen sein: Je 
nachdem, wie die Partikel genau verwendet wird, dürfte eine andere Bedeu- 
tungsumschreibung als passender erscheinen. In (35), einem weiteren Parla- 
mentsbeispiel, könnte man zum Beispiel sagen, dass die eher langsame Abwick- 
lung europapolitischer Angelegenheiten als (zumindest den im Plenarsaal an- 
wesenden Abgeordneten) allgemein bekannt gelten kann und weder vom Spre- 
cher noch von den anderen Abgeordneten geändert werden kann. Auch bei halt 
in (36) könnte man von Unabänderlichkeit sprechen, aber genauso gut könnte 
man sagen, dass die Betrachtung des Missgeschicks als Schicksalsfügung die ein- 
zig mögliche ist. Ähnlich liefert in (37) die eben-Äußerung den einzigen Grund, 
der nicht weiter diskutiert zu werden braucht. Zugleich zeigt dieses Beispiel, dass 
Partikeln wie eben (und halt), ähnlich wie ja und doch, vielfach in begründenden 
Äußerungen eingesetzt werden, in denen auch wieder mit der Konnexfunktion 
zu rechnen ist.” 


(35) AV: Die EU wird handlungsfähiger [...] wenn auch aufgrund der polni- 
schen Interventionen erst in zehn Jahren, aber so ist eben europäische 
Politik, dass es manchmal sehr lange dauert. 

(PR_VDBO0811) 


(36) UB: Wäre sie jetzt während der Operation gestorben, dann wär es halt 
Schicksal gewesen. Hat nicht geklappt, die Ärzte haben Fehler gemacht. 
(FG_B2a) 


(37) Gundi: Oh Gott, jetzt ist das T-Shirt völlig eingelaufen! 
Lina: Tja, du hast es eben zu heiß gewaschen. 
(Thurmair 1989: 121) 


Die Partikeln eben und halt können mit sehr ähnlicher Bedeutung auch in 
Aufforderungen verwendet werden. So markiert eben in (38), dass es auf der 
Hand liegt, dass man nicht ausgeht, wenn man noch so viel zu tun hat, während 


27 Neben der Interpretation dieser Konnexbeziehung als kausal/begründend gibt es Duplätre 
(1996: 35-40) zufolge noch weitere Möglichkeiten: konsekutiv, inferentiell, zusammenfassend 
usw. Allerdings enthalten die meisten seiner Beispiele jeweils andere Elemente wie Konjunktio- 
naladverbien, die explizit markieren, wie die Beziehung zu interpretieren ist, sodass dahinge- 
stellt bleiben muss, inwiefern es sich auch in diesen Fällen tatsächlich um potenzielle Facetten 
der Bedeutung von eben handelt. 
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halt in (39) andeutet, dass es ziemlich evident ist, dass man in die Werkstatt fährt, 
wenn der Wagen nicht in Ordnung ist. 


(38) Wenn du deine Arbeit rechtzeitig fertig haben willst, dann bleib eben 
mal zu Hause und arbeite. 
(Thurmair 1989: 123) 


(39) Max: Ich weiß nicht, was mit dem Auto los ist. Da scheppert dauernd 
was. 
Inge: Ja, dann fahr halt mal in die Werkstatt und lass es inspizieren. 
(Thurmair 1989: 126) 


Bislang wurde in der vorliegenden Beschreibung nicht systematisch zwi- 
schen eben und halt unterschieden. Die beiden Partikeln als reine Synonyme zu 
betrachten, wie es u.a. Held (1981: 250), Erichsen (1988: 30) und Autenrieth 
(2002: 95) tun, dürfte aber eine vorschnelle Verallgemeinerung sein. Gelegentlich 
wurde auch behauptet, es handle sich um rein regionale Varianten — eben sei 
norddeutsch, halt süddeutsch (u. a. Franck 1980: 235). Neuere Studien haben al- 
lerdings gezeigt, dass dies nicht (mehr) der Fall ist (u. a. Hentschel 1986: 13, Ditt- 
mar 2000: 212 und Autenrieth 2002: 93). Wie dem auch sei, einige Forscher gehen 
auch ohne Bezugnahme auf regionale Unterschiede davon aus, dass halt und 
eben nicht einfach als Synonyme zu betrachten sind. So sei eben Braber (2006: 
1491) zufolge stärker finalitätsbezogen, und Gornik (1998: 56) behauptet, dass 
sich eben vor allem auf vorher Erwähntes oder Etabliertes beziehe, halt dagegen 
eher auf eine Sprechermeinung, die als nicht weiter zur Diskussion stehend dar- 
gestellt werden solle. Thurmair (1989) macht einen ähnlichen Vorschlag, indem 
sie der Partikel eben eine etwas kategorischere Wirkung zuschreibt: Ihr zufolge 
markiere eben hörerbezogene Evidenz, halt dagegen hörerbezogene Plausibilität. 
An dieser Stelle kann die Frage des Verhältnisses zwischen eben und halt nicht 
endgültig geklärt werden, sie soll aber im Rahmen der Gestikanalyse wieder auf- 
gegriffen werden. 

Weniger kontrovers ist das Verhältnis zwischen eben und halt einerseits und 
einfach andererseits: Im Einklang mit etwa Confais/Schanen (1985) und Thurmair 
(1989) wird einfach generell als stärker subjektiv bzw. subjektbezogen betrachtet. 
Ähnlich wie bei eben und halt scheiden sich jedoch die Geister an der Frage, wie 
sich die Bedeutung von einfach am besten umschreiben ließe: Während Lütten 
(1977: 254) und Thurmair (1989: 132) von sprecherbezogener Evidenz sprechen, 
schlägt etwa Autenrieth (2002: 99) den Begriff der Unabänderlichkeit vor, und 
Burkhardt (1984: 88) zufolge markiere einfach einen Sachverhalt als dermaßen 
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offensichtlich oder unerklärlich für den Sprecher, dass weitere Befragung zweck- 
los sei (ähnlich auch Hartmann 1977: 112). 

Auch wenn ähnlich wie bei halt und eben kein Bedeutungsaspekt zu nennen 
ist, der sich in den Beschreibungen von einfach durchgesetzt hat, sind auch hier 
die erwähnten Bedeutungsfacetten nah verwandt: Weitere Erläuterungen erübri- 
gen sich. Dies betrifft sowohl die Verwendung in Aussagen als auch die Verwen- 
dung in Aufforderungen. In (40), zum Beispiel, wird ein subjektiver Sachverhalt 
(dass es sich um ein für den Sprecher und seine Genossen wichtiges Thema han- 
delt) als nicht weiter zur Diskussion stehend dargestellt, und in (41) markiert Inge 
es als aus ihrer Sicht auf der Hand liegend, dass man Personen, denen man dan- 
ken möchte, mangels besserer Geschenkideen Kinokarten schenkt. 


(40) HS: Wir wollen die Neutralität weiterhin bewahrt wissen; das ist uns ein- 
fach ein wichtiges Thema. 
(PR_Strache3010) 


(41) Lisa: Ich weiß nicht, wie ich mich bei den Hausers bedanken soll. 
Inge: Dann schick ihnen einfach ein paar Kinokarten! 
(Thurmair 1989: 134) 


Bislang wurde immer von Evidenz (bzw. Unkontroversheit, Plausibilität 
usw.) von Sachverhalten gesprochen. Allerdings kann die Evidenz auch auf me- 
tasprachlicher Ebene anzusiedeln sein. Das ist auch impliziert, wenn Spreckels 
(2009: 40) behauptet, einfach sei gelegentlich auch „ein Indikator für kommuni- 
kative Schwierigkeiten“. In dem Fall bezieht sich einfach also nicht an erster 
Stelle auf den Inhalt der Äußerung, sondern vielmehr auf die Form bzw. die For- 
mulierung. In dieser Verwendung markiert der Sprecher mit einfach, dass er 
keine andere gelungene bzw. keine passendere Formulierung findet. Es ist also 
die Formulierung (und nicht der Sachverhalt), die als einzigmöglich (bzw. als evi- 
dent usw.) markiert wird.” 


28 Ähnlich hat Thaler (2010) darauf hingewiesen, dass Partikeln wie eben, halt und ja eingesetzt 
werden können, um Unsicherheit zu maskieren. Obwohl Thaler vor allem auf Unsicherheit mit 
Bezug auf Sachverhalte eingeht, dürfte dies auch für Unsicherheit in der Formulierung gelten. 
Umgekehrt dürfte einfach, aufgrund der Bedeutungsähnlichkeit mit halt und eben, ebenso als 
Maskierer der Unsicherheit hinsichtlich des Sachverhalts einsetzbar sein. 
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(42) Ich finde dich nett ähm cool, ähm... ja einfach voll lieb. 
(http://www.board-server.de/cgi-bin/foren/F_2799/forum.pl?ac- 
tion=hand&forum=46&thread=623&:msgid=73&query=73, Zugriff 
20.12.2013, Rechtschreibung standardisiert) 


In Beispiel (42) wird einfach außerdem in einer bewertenden Äußerung ver- 
wendet. Aufgrund von solchen Fällen, die einen nicht unwichtigen Teil der Be- 
lege von einfach auszumachen scheinen, wurde gelegentlich behauptet, einfach 
sei im Grunde genommen nicht eine Modalpartikel, sondern - wenigstens in die- 
sen Kontexten - vielmehr eine Steigerungspartikel (u. a. Autenrieth 2002: 81). Al- 
lerdings stellt sich die Frage, ob die angeblich intensivierende Wirkung von ein- 
fach nicht als Effekt der Evidenzmarkierung zu betrachten ist: Wenn man etwas 
als gänzlich außer Streit gestellt betrachtet und das auch markiert, so wirkt die 
Aussage fast per definitionem stärker, als wenn man diese Markierung nicht hin- 
zugefügt hätte. Diese Diskussion soll in Kapitel 7 wieder aufgegriffen werden. 

Eine weitere Anmerkung betrifft die Subjekt- bzw. Sprecherbezogenheit, die 
einfach von eben und halt unterscheiden soll. Man sollte sich darüber im Klaren 
sein, wer als ‚Subjekt‘ betrachtet wird, denn tatsächlich dürfte das auch eine an- 
dere Person als der aktuelle Sprecher sein. Das ist, was Döring (2013) als die ‚Kon- 
textverschiebung‘ (‚context shift‘) bei Modalpartikeln bezeichnet. Tatsächlich ist 
es möglich, einen Satz wie (43) so zu interpretieren, dass nicht der aktuelle Spre- 
cher, sondern vielmehr Herr Anthes für die Abtönung verantwortlich ist. In dem 
Fall hätte Herr Anthes selber in seiner Rede die Partikel eingesetzt, und der aktu- 
elle Sprecher hätte sie bei der Vermittlung der Aussage von Herrn Anthes beibe- 
halten bzw. ‚geechot‘ (vgl. Verstraete 2001: 1514). 


(43) Präsident Klaus Anthes erklärte in der Jahreshauptversammlung, dass 
es einfach zu wenig engagierte Vereinsmitglieder gebe, die dabei helfen, 
die Partys und Sitzungen zu stemmen. 

(COSMAS-II, Teilkorpus non) 


In (43) ist aufgrund der Satzstruktur (indirekte Rede) klar, dass auf die Aus- 
sage einer anderen Person zurückverwiesen wird. Allerdings scheint es auch 
ohne eine solche Matrixstruktur möglich zu sein, dass die Abtönung einer ande- 
ren Person geechot wird - wenngleich Döring (2013) nicht auf solche Fälle ein- 
geht. Ein Beispiel ist (44). In diesem Fall ist zwar nicht auszuschließen, dass die 
Evidenzmarkierung durch einfach vom aktuellen Sprecher ausgeht, aber wenigs- 
tens genauso wahrscheinlich ist die Analyse, dass Weinberger selber es als nicht 
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weiter zur Diskussion stehend betrachtet hat, dass er nicht mehr für den ange- 
sprochenen Fußballverein (den FC Purkersdorf) antreten wollte, und dass diese 
Abtönung dann echoend vom aktuellen Sprecher übernommen wurde. 


(44) Weinberger wollte einfach nicht mehr in Purkersdorf bleiben, er hätte 
den Klub auf jeden Fall verlassen. 
(COSMAS-II, Teilkorpus non) 


Interessant sind in diesem Zusammenhang auch Beispiele von Partikeln in 
Komplementsätzen. Vielfach wird davon ausgegangen, dass Modalpartikeln in 
faktiven Komplementsätzen nicht vorkommen könnten (u. a. Coniglio 2011: 139), 
es sei denn, dass die Faktivität durch inhaltliche Faktoren abgeschwächt oder gar 
aufgehoben werde (z. B. durch Zukunftsbezug im Komplementsatz, da mit der 
Zukunft immer eine gewisse Unsicherheit einhergeht, vgl. dazu auch Abraham 
2012: 90). Allerdings zeigt Döring (2013: 108) anhand von Beispielen wie (45), 
dass es durchaus möglich ist, dass Partikeln wie ja in faktiven Komplementsätzen 
auftreten, weil sowohl die Partikel als auch das faktive Verb die Wahrheit des 
Sachverhalts voraussetzen. Auch für andere Partikeln der Cluster 2a/b scheint 
dies möglich zu sein, wie (46) zeigt. 


(45) Max weiß, dass Paul ja niemandem etwas sagen würde. 
(Döring 2013: 108) 


(46) Sein Schmunzeln verrät, dass es halt doch nicht so einfach ist, mit hun- 
dertjährigen Skis den Hang hinunter zu fahren. 
(COSMAS-II, Teilkorpus soz) 


Allerdings ist das Einsetzen einer Modalpartikel in einem solchen Kontext 
nicht ohne Weiteres möglich, wie Coniglio (a. a. O.) anhand von Beispielen wie 
(47) zeigt. Aufgrund der Analyse von Döring wäre zu erwarten, dass auch das 
mögliche Auftreten der Partikeln in faktiven Komplementsätzen durch Kontext- 
verschiebung zu erklären wäre (obwohl dies für (46) weniger offensichtlich sein 
dürfte). Dafür spricht jedenfalls, dass in (45-46) das Subjekt des Matrixsatzes je- 
weils auf eine konkrete Person verweist, die bei der Kontextverschiebung einbe- 
zogen sein könnte, während in (47) ein unpersönlicher Satz vorliegt.” 


29 Gegen diese Analyse spricht auf den ersten Blick ein Beispiel wie (ii), das ebenfalls von 
Coniglio (a. a. O.) zur Untermauerung der Ablehnung von Modalpartikeln in faktiven Komple- 
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(47) *Es stimmt, dass Udo ja verheiratet ist.” 
(Coniglio 2011: 139) 


Auch hier bildet einfach eine Ausnahme: Obwohl es nicht sehr oft vorkommt, 
lassen sich Belege wie (48) finden, in denen einfach in einem Komplementsatz 
mit faktivem, aber unpersönlichem Matrixverb steht. In diesem Fall wird die Ab- 
tönung geechot: Eine andere Person hat früher in der Diskussion eine einfach- 
Äußerung realisiert, und der aktuelle Sprecher stimmt dieser Äußerung zu. Dass 
dies mit einfach besser geht als etwa mit ja, dürfte an der Subjektivität der Evi- 
denzmarkierung von einfach liegen: Was für den Abtönenden evident ist, ist es 
nicht unbedingt auch für andere (obwohl aufgrund der Evidenzbedeutung 
durchaus mit Zustimmung gerechnet wird). Die anderen Partikeln der Cluster 
2a/b markieren eine allgemeinere, objektivere Bekanntheit oder Evidenz, die kei- 
ner weiteren Bestätigung bedarf. In (48) stimmt der aktuelle Sprecher nämlich 
nicht nur (bzw. nicht an erster Stelle) dem erwähnten Sachverhalt zu, sondern 
der Abtönung dieses Sachverhalts durch einfach: Der Sprecher gibt an, dass er 
selber die subjektive Einstufung des Sachverhalts durch den geechoten Sprecher 
als evident teilt, allerdings ohne diese Evidenz auch als allgemein geltende und 
von allen geteilte Perspektive darstellen zu wollen, wie das bei weniger subjekti- 
ven Partikeln wie ja oder eben der Fall wäre. 


(48) Aber es stimmt, dass es einfach nicht jedem steht. 
(http: //www.hochzeitsplaza.de/hochzeits-forum, Zugriff 30.12.2013) 


mentsätzen angeführt wird: Obwohl das Matrixverb nicht unpersönlich ist, wird der Komple- 
mentsatz mit Partikel als inakzeptabel eingestuft. Allerdings ist dieser Satz schon alleine daher 
problematisch, weil die Bedeutungen von ja und leugnen nicht miteinander verträglich sind: Ja 
markiert Wahrheit, also gerade das Gegenteil von leugnen. 


(ii) *Er leugnete, dass er die Zeugin ja unter Druck gesetzt habe. 
(Coniglio 2011: 139) 


30 Im Internet findet man zwar Belege für diese Struktur. Diese sind aber so selten, dass die 
Struktur durchaus als ungebräuchlich gelten kann. 


(ii) Ich bin auch auf der Suche, welchen Selbstbräuner sie benutzt! Weil es stimmt, dass sie ja 
schon von Natur aus dunkler ist, aber sie benutzt noch einen Selbstbräuner; dummerweise 
habe ich den Namen vergessen... 
(http://www.gutefrage.net/frage/so-braun-wie-eva-longoria-was-benutzt-sie, Zugriff 
30.12.2013, Rechtschreibung standardisiert) 
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Ähnlich scheint die Situation bei der Verwendung von einfach in Entschei- 
dungsfragen zu sein (49). Auch in diesem Fall spielt die subjektive Evidenzbe- 
deutung eine Rolle. Thurmair (1989: 133) ist der Meinung, dass tatsächlich der in 
Frage gestellte Sachverhalt die für den Sprecher evidente Erklärung eines vorher 
erwähnten Sachverhalts ist. Ähnlich werde laut Brünjes (2014: 129) der Inhalt der 
Frage „bezüglich seiner Gültigkeit erfragt“ und es liege eine „positive Antworter- 
wartung“ vor. Allerdings suggerieren Beispiele wie (49), dass vielmehr gerade ge- 
fragt wird, inwiefern der Hörer den angesprochenen Sachverhalt als die evidente 
Erklärung betrachtet: Nicht der Sachverhalt wird erfragt, sondern inwiefern ihn 
der Gesprächspartner als evident einstuft.” In (49) ist die Rede von Schifahrerin 
Maria Höfl-Riesch, die bei einem Weltcupslalom das Podest knapp verfehlt hat. 
Das Verfehlen des Podestes ist also der vorher erwähnte und zu begründende 
Sachverhalt, und der Reporter (WN) fragt Martina Ertl-Renz (ME), inwiefern es als 
auf der Hand liegende (und dementsprechend wichtigste oder einzig relevante) 
Erklärung zu sehen ist, dass ihr der Kurs nicht lag. 


(49) WN: Martina, du hast ihre Fahrt genau angeschaut. Ist sie zu ängstlich, 
zu vorsichtig gefahren, oder war es einfach nicht ihr Kurs? 
ME: Es war generell schon nicht ihr Kurs, weil es sehr steil und drehend 
war. Maria mag lieber langgezogene Kurven. Und natürlich war die 
Sicht sehr schlecht; das hat sie auch ein bisschen gehemmt. 
(FG_A3b) 


Diese Verwendung wurde in der Literatur bislang nur für einfach, nicht je- 
doch für eben und halt analysiert. Tatsächlich scheint eine solche Verwendung 
von eben und halt wesentlich seltener zu sein, obwohl Brünjes (2014: 128-129) 
zeigt, dass sie nicht ganz ausgeschlossen ist (vgl. dazu auch Duplätre 1996: 22- 
24). Diese Distribution dürfte erneut mit der subjektiveren Natur von einfach zu 
tun haben. Wenn ein Sachverhalt als objektiv evident gilt (wie es eben und halt 
markieren), so braucht man nicht danach zu fragen. Subjektive Evidenz dagegen 
wird nicht per definitionem von vornherein von allen Gesprächspartnern geteilt, 
sondern sie besteht nur für die Person, die den Sachverhalt als evident betrachtet. 
In diesem Fall ist es also durchaus möglich, die Frage zu stellen, ob ein bestimm- 
ter Sachverhalt für eine Person als evident gilt. Diese personengebundene bzw. 
subjektive Evidenz wird eher durch einfach markiert, sodass diese Partikel auch 


31 Dies ist auch im Einklang mit der Beobachtung von Verstraete (2001: 1521), dass subjektive 
Modalität in Fragen als „oriented towards the interlocutor“ zu sehen ist: Evidenz für den Ge- 
sprächspartner, nicht für den Sprecher. 
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leichter in Fragen einzusetzen ist als eben und halt. Die Kontextverschiebung, die 
die Verwendung von einfach in Entscheidungsfragen ermöglicht (vgl. Döring 
2013: 112 zu Kontextverschiebung in Fragen), wird ihrerseits selber dadurch er- 
möglicht, dass einfach subjektiver ist als halt und eben (vgl. die Besprechung zu 
(49)).2 

Ob damit die vollständige Erklärung für das Auftreten von einfach in faktiven 
Komplementsätzen und Entscheidungsfragen geliefert ist, dürfte anhand der 
Gestikanalyse im Folgenden schwierig zu bestimmen sein; jedenfalls enthalten 
auch die verwendeten Korpusdaten keine Belege von eben und halt in Entschei- 
dungsfragen. Weitere Aspekte der Besprechung von Cluster 2b, wie das genaue 
Verhältnis von eben und halt, die Einstufung von einfach als Steigerungspartikel 
und die Möglichkeit der Kontextverschiebung bei einfach, sollen aber im empiri- 
schen Teil wieder aufgegriffen werden. 


32 Vgl. auch Gutzmann (2014) zu Unterschieden auf der Ebene des Ausmaßes, in dem die ein- 
zelnen Modalpartikeln Kontextverschiebung erlauben. 


3 Multimodalität 


3.0 Einführung 


In vorliegender Arbeit soll es darum gehen, zu untersuchen, inwiefern die im vo- 
rigen Kapitel beschriebenen Modalpartikeln Teil multimodaler Konstruktionen 
sein könnten. Wie in dieser Umschreibung die Bezeichnung ‚multimodal‘ aufzu- 
fassen ist, ist das Thema dieses dritten Kapitels. Nachdem zunächst geklärt wor- 
den ist, wie der Begriff ‚multimodal‘ zu interpretieren ist (3.1) und welche Dimen- 
sionen der Multimodalität für die Abtönungsforschung relevant sind (3.2), sollim 
Abschnitt 3.3 auf die für die folgende Analyse zentrale Dimension der Multimo- 
dalität eingegangen werden: die Gestik. Geklärt werden soll unter anderem, mit 
welchem Gestikbegriff gearbeitet wird und wie sich dieser zum Sprachkonzept 
verhält. 


3.1 Multimodalität 


„All interactions are multimodal.“ Mit dieser These eröffnet Norris (2004: 1) ihr 
Buch zur Analyse multimodaler Interaktion. Dass in einer Interaktion im Normal- 
fall mehrere Kommunikationsmodi miteinander interagieren, dürfte mittlerweile 
als eine eher unkontroverse Behauptung erscheinen. Wichtiger für die vorlie- 
gende Arbeit ist aber die Ergänzung, die Bezemer/Jewitt (2010: 183) liefern, dass 
all diese Kommunikationsmodi auch zur Bedeutung beitragen, und dass mit an- 
deren Worten die Bedeutung nicht nur verbal vermittelt wird. Dementsprechend 
ist die Ansicht gewachsen, dass eine adäquate Analyse authentischer Kommuni- 
kation nur dann möglich ist, wenn auch alle nonverbalen Kommunikationsmodi 
sowie ihre Interaktion untereinander wie mit der verbalen Ausdrucksebene in Be- 
tracht gezogen werden und gar einen gleich prominenten Stellenwert zugewie- 
sen bekommen wie traditionell das Verbale (Weinrich 1992: 14, Schmitt 2005: 23, 
vgl. auch u. a. Mondada 2013: 582). 

Die Frage, was nun genau mit ‚Multimodalität‘ gemeint ist bzw. was es heißt, 
wenn mehrere Kommunikationsmodi zusammenwirken, dürfte auf den ersten 
Blick als ziemlich einfach erscheinen, ist jedoch nicht so leicht zu beantworten, 
da in der Literatur mehrere zwar miteinander verwandte aber trotzdem unter- 
schiedliche Konzeptionen des Begriffs ‚Multimodalität‘ vorzufinden sind. Einen 
umfassenden Überblick der unterschiedlichen Multimodalitätsauffassungen zu 
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liefern, ist im Rahmen der vorliegenden Arbeit nicht möglich; deswegen be- 
schränke ich mich auf zwei Auffassungen, die dem Begriff ‚Multimodalität‘ den 
eng damit zusammenhängenden Begriff ‚Multimedialität‘ gegenüberstellen. 

Kress/Van Leeuwen (2001: 1-2) liefern eine ziemlich einfache Definition: 
Multimodalität ist die Interaktion mehrerer semiotischer Codes bzw. Kommuni- 
kationsebenen (für gesprochene Interaktion typischerweise Verbales, Gestik 
usw.). Wichtig ist dabei vor allem der Begriff der Interaktion: Die Ebenen stehen 
nicht einfach nebeneinander, sondern wirken für das Vermitteln der Bedeutung 
wirklich zusammen. Als Sondertyp der Multimodalität unterscheiden Kress/Van 
Leeuwen die Multimedialität. Dieser Begriff impliziert, dass die unterschiedli- 
chen Kommunikationsmodi unterschiedlichen Perzeptionsebenen bzw. Sinnes- 
modalitäten zuzuweisen sind. Ein geschriebener Text kann zum Beispiel multi- 
modal sein (Interaktion des geschriebenen Wortes mit Farben, Abbildungen 
usw.) und trotzdem als monomedial einzustufen sein (das Verbale, die Figuren 
usw. sind alles visuell wahrnehmbar). Gespräche wie die im Folgenden zu analy- 
sierenden sind dagegen multimodal (Verbales, Gestik usw.) und multimedial 
(das Verbale ist hörbar, die Gestik ist sichtbar). 

Die beiden Begriffe ‚Multimodalität‘ und ‚Multimedialität‘ verwendet auch 
Ellen Fricke (2012). Allerdings bezieht sie sich nicht auf die Sinnesmodalitäten, 
um die Begriffe auseinanderzuhalten. Für Fricke (2012: 43-46) ist eine Interak- 
tion multimodal, wenn eine strukturelle Integration der unterschiedlichen Kom- 
munikationsmodi in einen übergreifenden Matrixcode vorliegt. Stehen die Modi 
eher separat nebeneinander, so ist die Interaktion multimedial. Obwohl diese 
Grenze weniger deutlich zu ziehen sein dürfte, als es die Definition suggeriert, 
sind auf jeden Fall die sprachlichen Interaktionen, aus denen das Korpus für vor- 
liegende Arbeit besteht, in diesem Sinne immer als multimodal zu betrachten, da 
die unterschiedlichen Modi (Verbales, Gestik usw.) als Teile einer Sprache bei der 
Vermittlung der Bedeutung zusammenwirken (vgl. dazu Abschnitt 3.3.2). 

Die Vermutung liegt nahe, dass der Unterschied zwischen den beiden Kon- 
zeptionen auf unterschiedliche Ziele der jeweiligen Analysen von Kress/Van Lee- 
uwen und Fricke zurückzuführen ist. Kress/Van Leeuwen arbeiten vor allem mit 
geschriebenen Materialien. Für sie ist also der Unterschied relevant, ob nur eine 
Sinnesmodalität (die visuelle) im Spiel ist, oder ob doch auch andere Arten der 
Wahrnehmung ins Spiel kommen (zum Beispiel, indem zusätzlich zum geschrie- 
benen Text auch gesprochen wird). Fricke dagegen befasst sich mit gesproche- 
nen Interaktionen. Für sie ist also an erster Stelle wichtig, ob das Hörbare (d. h. 
das Gesagte) und das Sichtbare (Gestik, Mimik usw.) zusammengehören und ge- 
meinsam eine Bedeutung vermitteln oder vielmehr einfach nebeneinander beste- 
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hen. Da im Rahmen der vorliegenden Arbeit ebenfalls mit gesprochenen Interak- 
tionen gearbeitet wird, erscheint es als angemessen, im Folgenden Frickes Mul- 
timodalitätsbegriff heranzuziehen. 


3.2 Relevante Dimensionen der Multimodalität 


Hinsichtlich der großen Vielfalt an nonverbalen Ausdrucksebenen stellt sich die 
Frage, welche Ebenen für eine Analyse von Abtönung relevant sind bzw. sein 
könnten. Aus den im einführenden Kapitel angeführten Zitaten von Schulz und 
Werner geht schon hervor, dass Mimik und Gestik sowie Intonation bzw. Proso- 
die — sofern man letztere nicht schon als verbal betrachtet - heranzuziehen wä- 
ren. Allerdings ist damit nicht das ganze Spektrum multimodaler Größen abge- 
deckt. Dementsprechend soll die Frage an dieser Stelle nochmals aufgegriffen 
werden. 

Da im Folgenden an erster Stelle mit gesprochenen Daten gearbeitet wird, 
dürften die Aspekte, die Kress/Van Leeuwen (2001) in ihrer Analyse von vor allem 
schriftsprachlichen Materialien fokussieren, für vorliegende Arbeit von geringe- 
rer Wichtigkeit erscheinen. Trotzdem ist es möglich, dass eine Rede durch Ge- 
schriebenes unterstützt wird, zum Beispiel durch eine Folienreihe oder ein Pla- 
kat, das während der Rede gezeigt wird, um den Aufbau oder den Inhalt zu 
verdeutlichen oder den eigenen Argumenten Nachdruck zu verleihen. Letzteres 
macht zum Beispiel Heinz-Christian Strache in seiner Parlamentsrede vom 8. No- 
vember 2007: In seiner Rede plädiert er für eine EU-weite Volksabstimmung, und 
diese Botschaft steht auch auf einem Schild, das er vor sich aufgestellt hat (‚EU- 
Volksabstimmung sichern!‘, Abbildung 1). 


Abb. 1: Multimediale Parlamentsrede (PR_Strac0811) 
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In diesem Fall kann man sich jedoch Fragen, inwiefern man es nicht mit Mul- 
timedialität im Fricke’schen Sinne zu tun hat. Zwar ist der Text auf dem Plakat 
genauso sprachlich wie die Rede selbst, aber trotzdem ist die Integration in den 
übergreifenden sprachlichen Matrixcode als geringer zu betrachten als bei etwa 
gesprochenen Worten und Gestik (vgl. Fricke 2012: 41 und Abschnitt 3.3.2). Damit 
zu verknüpfen ist auch die Tatsache, dass solche vorbereiteten Folien oder Pla- 
kate nicht so spontan vor Ort realisiert werden wie das Gesagte und die Gestik.' 
In dieser Hinsicht ähneln solche geschriebenen Unterlagen eher Ausdruckskanä- 
len wie Kleidung, Frisur, Tätowierungen usw., die ebenfalls der eigenen Persön- 
lichkeit, politischen Orientierung u. dgl. Ausdruck verleihen können (vgl. Argyle 
1988) aber weniger spontan vor Ort realisiert werden als etwa Gesten. Daher wer- 
den diese Ausdrucksebenen unter dem Nenner der Multimedialität (und nicht der 
Multimodalität) geführt und im Folgenden nicht weiter in Betracht gezogen. 

Ausdruckskanäle, die durchaus als spontan und als (potenziell) relevant zu 
betrachten sind, sind dagegen Gestik, Mimik, Blickverhalten, Körperhaltung, 
Proxemik u. dgl. Angesichts der Möglichkeiten, die eine Arbeit wie die vorlie- 
gende bietet, musste jedoch eine Auswahl getroffen werden, und wie bereits an- 
gedeutet wurde, ist für eine Analyse der Gestik optiert worden. Allerdings sei da- 
mit keineswegs behauptet, dass Gestik die einzige nonverbale Ausdrucksebene 
wäre, die bei Abtönung eine Rolle spielt: Abtönung ist kein diadisches Verhältnis 
von Verbalem und Gestischem, sondern vielmehr ein komplexes Zusammenwir- 
ken mehrerer (wenn nicht gleich aller) spontaner Ausdrucksebenen. Um zu ei- 
nem vollständigen Bild des Funktionierens von Abtönung zu kommen, müsste 
eigentlich die gesamte Interaktionssituation einschließlich aller als (potenziell) 
relevant eingestuften Ausdrucksebenen und deren Interaktion analysiert wer- 
den. In der Hinsicht liefert die vorliegende Arbeit nur ein fragmentarisches Bild 
der Möglichkeiten multimodaler Abtönung, und wenn im Folgenden zu einem 
Modalpartikelbeleg behauptet wird, dass keine abtönende Gestik vorliegt, so 
heißt das nicht unbedingt, dass keine nonverbale Abtönung auf einer anderen 
Ebene nachweisbar ist. 


1 Der Text der Rede selbst ist zwar vielfach auch wenigstens teilweise vorbereitet, was an sich 
auch die Spontaneität der Rede einigermaßen verringert. Er dürfte aber im Allgemeinen weniger 
fixiert und zum Zeitpunkt der Rede noch leichter abänderbar sein als etwa das Plakat, das 
Strache verwendet. 
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3.3 Gestik 


3.3.1 Definition 


Ähnlich wie ‚Modalpartikel‘ und ‚Multimodalität‘ ist auch ‚Gestik‘ ein Begriff, der 
in der Literatur unterschiedlich definiert worden ist (vgl. Armstrong/Stroke/Wil- 
cox 1995: 38). Im Folgenden soll von der von Calbris (2011: 6) vorgeschlagenen 
Definition ausgegangen werden. Sie definiert Gestik als 


the visible movement of any body part consciously or unconsciously made with the inten- 
tion of communicating while speech is being produced. 


Inwiefern Gestik tatsächlich bewusst oder unbewusst realisiert wird, ist eine 
heikle und lebhaft diskutierte Frage. Da sie für die folgende Analyse von geringe- 
rer Wichtigkeit ist, soll an dieser Stelle nicht weiter darauf eingegangen werden. 
Wichtiger für die Bestimmung des verwendeten Gestikbegriffs sind drei andere 
Aspekte dieser Definition, die im Folgenden weiter besprochen werden. 

Ein erster Punkt ist die Einschränkung „while speech is being produced.“ Ge- 
meint ist damit, dass Gestik ko-verbal realisiert wird. Dies erlaubt es, Gesten von 
den Zeichen in Zeichen- und Gebärdensprachen zu unterscheiden, die im Nor- 
malfall nicht durch Sprechen begleitet werden, sondern vielmehr selber das 
Sprechen sind.’ In diesem Sinne wird hier von einem enger definierten Gestikbe- 
griff ausgegangen, als etwa bei Kendon (u. a. 1985, 2004) der Fall ist. Für Kendon 
umfasst die Kategorie der Gestik „any distinct bodily action that is regarded by 
participants as being directly involved in the process of deliberate utterance“ 
(1985: 215). Für ihn sind Zeichen- und Gebärdensprachen also auch als Formen 
von Gestik zu betrachten, während im Folgenden der Gestikbegriff auf sprachbe- 
gleitende Gesten beschränkt wird. 

Allerdings sei zur Qualifizierung „while speech is being produced“ ange- 
merkt, dass sie keine zeitliche Überlappung unterstellt. Tatsächlich kann eine 
Geste während einer kurzen Sprechpause realisiert werden. Streng genommen 
wird die Geste dann nicht produziert, während gesprochen wird, aber trotzdem 


2 In diesem Sinne wäre es möglich, auch in Gebärdensprachen von der Möglichkeit der Existenz 
von Gesten auszugehen, die zusätzlich zu den eigentlichen Sprachzeichen (die dann als ‚speech‘ 
gelten) realisiert werden - sofern dies artikulatorisch möglich ist. Tatsächlich wurde in der Lite- 
ratur schon angedeutet (u. a. Özyürek 2012: 636), dass Gestikkomponenten bei der Gebärdenpro- 
duktion eine Rolle spielen könnten (vgl. auch Vermeerbergen/Demey 2007). 
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kann sie als sprachbegleitend bzw. ko-verbal gelten. Zudem impliziert die Einstu- 
fung als ‚ko-verbal‘ nicht, dass ein hierarchisches Verhältnis bestünde, nach dem 
die Gestik dem Verbalen untergeordnet wäre: Gestik und Verbales werden als 
gleichwertig und als gleichermaßen zur Bedeutungsvermittlung beitragend be- 
trachtet. 

Der zweite Punkt betrifft die körperliche Realisierung. Es wird angenommen, 
dass eine Geste mit „any body part“ hervorgebracht werden kann. Eine Ein- 
schränkung auf Hand- und Armbewegungen, wie sie Müller (1998: 13) noch vor- 
geschlagen hat, wird hier also nicht durchgeführt. Vielmehr wird davon ausge- 
gangen, dass auch andere Körperteile zum Gestikulieren eingesetzt werden 
können. Für die im Folgenden darzulegende Analyse sind, neben den Hand- und 
Armgesten, insbesondere Kopfgesten relevant, aber wie Fricke (2007: 279) ge- 
zeigt hat, können zum Beispiel Zeigegesten durchaus auch etwa mit dem Fuß re- 
alisiert werden. 

Der dritte und letzte Punkt ist weniger explizit aus der Definition von Calbris 
abzuleiten, ist aber durchaus darin impliziert: Dieser Gestikbegriff umfasst auch 
Embleme. Embleme unterscheiden sich von anderen Gesten darin, dass sie so- 
wohl was die Form betrifft als auch auf Bedeutungsebene wesentlich stärker kon- 
ventionalisiert sind. Während vielfach davon ausgegangen wird, dass Gesten nur 
im konkreten Gebrauchskontext ihre eigentliche Bedeutung erhalten und dem- 
entsprechend nur unter Berücksichtigung des Gesprochenen zu interpretieren 
sind (u. a. Fricke 2007: 143, 146), ist diese Kontextabhängigkeit bei Emblemen 
deutlich geringer, da ihre Bedeutung mehr oder weniger festliegt. Aus diesem 
Grund betrachtet McNeill (2005) Embleme nicht als Subtyp von ‚gesticulation‘, 
dem Begriff, unter dem er die anderen typischen Gestentypen (vgl. Abschnitt 
3.3.3) zusammenführt (und den er seinerseits von Kendon [u. a. 1988] übernom- 
men hat). Er leugnet aber nicht, dass Embleme durchaus eine beachtliche Ähn- 
lichkeit mit den anderen Gesten aufweisen, die es ermöglicht, dass Embleme 
durch die ‚gesticulation‘-Kategorie „absorbiert“ (McNeill 2012: 5) werden. Auf- 
grund ebendieser Ähnlichkeit werden auch im Folgenden die Embleme immer- 
hin zu den Gesten gezählt (vgl. auch Müller 1998: 110). 


3.3.2 Gestik als Teil der Sprache 


Dass multimodale Größen wie Gestik mittlerweile als inhärenter Teil der Kommu- 
nikation gelten, wurde oben bereits angemerkt. Wenn allerdings Gestik so stark 
mit dem verbal Ausgedrückten interagiert, stellt sich die Frage, inwiefern Verba- 
les und Gestisches als Realisierungsebenen eines einzigen Systems zu betrachten 
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sind. Im Anschluss an der Diskussion zum Multimodalitätsbegriff ließe sich tat- 
sächlich behaupten, dass dem so ist: Gestik und Verbales sind nicht nur stark 
miteinander verwoben, sie wirken auch zusammen beim Vermitteln der Bedeu- 
tung und können dementsprechend als in einem Matrixcode integriert betrachtet 
werden, was auch die Voraussetzung war, um von Multimodalität im Fri- 
cke’schen Sinne sprechen zu können. 

Für die Integration von Verbalem und Gestischem in einem Matrixcode spre- 
chen verschiedene Argumente. Fin erstes ist die bereits mehrfach angesprochene 
enge Vernetztheit in der Äußerung: Gestik ist vielfach nicht ohne das Verbale zu 
interpretieren, kann aber selber auch das verbal Geäußerte desambiguieren oder 
präzisieren oder gar Verbales ersetzen (vgl. u. a. Kendon 1988: 133). Zudem sind 
Gesten vielfach direkt mit bestimmten Elementen der verbalen Äußerung zu ver- 
knüpfen, den sogenannten lexikalischen Partnern (‚lexical affiliates‘), und diese 
Verknüpfung zeigt sich vielfach auch im Timing der Gesten (vgl. u. a. McNeills 
[1992] Synchronieregeln). Die Verbindung von Gestik und Verbalem reicht jedoch 
weiter als die Oberflächenebene der realen Äußerungen: In psychologisch orien- 
tierten Studien wurden Modelle vorgestellt, die besagen, dass Gesten und Verba- 
les mental wenigstens zum Teil gemeinsam verarbeitet werden und dementspre- 
chend Teil einer und derselben psychologischen Struktur sind (u. a. McNeill 1985, 
Kita/Özyürek 2003, Feyereisen 2013). Dafür sprechen auch die Ergebnisse von Ex- 
perimenten, bei denen den Teilnehmern das Gestikulieren verhindert wird: Wenn 
die Teilnehmer keine Gesten produzieren dürfen bzw. können, verläuft das Spre- 
chen auch erheblich mühsamer (vgl. de Ruiter 2003 für eine Übersicht). Abgese- 
hen von dieser Tatsache wirkt Sprechen ohne Gesten auch für den Hörer unna- 
türlich. Auch wenn man die Gesten für die Kommunikation nicht unbedingt 
braucht (sonst wäre Kommunikation ohne Blickkontakt, zum Beispiel am Tele- 
fon, unmöglich), so erscheint das Sprechen doch als weniger fließend oder na- 
türlich, wenn die Gesten fehlen. 

Fricke (2015: 51) selber orientiert sich allerdings eher an anderen Kriterien. 
Bezogen auf Einzelsprachen spricht sie von Multimodalität, „wenn verschiedene 
Medien in dieselben sprachlichen Strukturen eintreten können - etwa die Sub- 
stitution einer lautsprachlichen Konstituente durch eine gestische Konstituente 
in derselben syntaktischen Position — oder dieselben sprachlichen Funktionen 
erfüllen können“. Ersteres ist zwar für die im Folgenden zu besprechenden Ges- 
ten eher nicht der Fall: Die mit Modalpartikeln zusammenhängenden Gesten tre- 
ten eher selten in einem verbal unbesetzten syntaktischen Slot auf, wie das für 
andere Gesten durchaus möglich ist (etwa in einem Satz wie Ich fühle mich heute 
so [Geste]) - auch wenn sich herausstellen wird, dass die Gesten auch ohne die 
Partikeln eingesetzt werden können und also doch gewissermaßen die einzigen 
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Elemente sind, die diesen Abtönungsslot befüllen. Dass diese Gesten „dieselben 
sprachlichen Funktionen erfüllen können“ wie verbale Elemente (insbesondere 
also wie Modalpartikeln), wird sich ebenfalls im Folgenden noch zeigen. Dass es 
sich hier eher um pragmatische Funktionen handelt und nicht um die syntakti- 
schen Funktionen, die Fricke vor allem als Beispiele anführt, ist m. E. kein Argu- 
ment gegen den zumindest ‚sprachlichen‘ Status dieser Gesten.’ 

Im Hinblick auf all diese Punkte scheint es m. E. gerechtfertigt, von einem 
Matrixcode auszugehen, der Verbales und Gestik (inklusive der mit Modalparti- 
keln einhergehenden Gesten) umfasst. Zu klären bleibt allerdings noch die Frage, 
wo in diesem System der Begriff ‚Sprache‘ anzusiedeln ist: Ist die Sprache der 
Matrixcode, oder beschränkt sich diese Bezeichnung dann doch auf das Verbale? 
Wie McNeill (2005: 21) angibt, hängt das davon ab, wie man den Begriff ‚Sprache‘ 
interpretiert. Unter Einfluss der linguistischen Tradition, die das Verbale fokus- 
siert, ist die Konzeption von ‚Sprache‘ vielfach auf das Verbale beschränkt. 
Gleichwohl scheint es aber gerechtfertigt, ‚Sprache‘ als Bezeichnung des Mat- 
rixcodes zu verwenden. Der Kanal, den man beim Sprechen zur Vermittlung von 
Informationen verwendet, und der traditionell als ‚Sprache‘ bezeichnet wird, ist 
eben dieser Matrixcode, der Verbales und Gestik umfasst. Ähnlich formuliert es 
auch McNeill (a. a. O.): Als ‚Sprache‘ bezeichnet man „what it is we know when 
we say we ‚know a language‘ or what we ‚use‘ when we speak, listen, read, etc.“ 
Tatsächlich gehört Gestik zum spontanen Sprachgebrauch, aber zudem ist Gestik 
wenigstens zum Teil auch sprach- bzw. kulturspezifisch. Dies gilt nicht nur für 
Embleme, deren Kulturspezifizität schon länger bekannt ist (s. u. a. McNeill 
1992): Auch weitere Aspekte der Gestik können von der Kultur beeinflusst wer- 
den. Wenn zum Beispiel für ein Konzept in einer Sprache kein separater verbaler 
Ausdruck besteht, so ist das meist auch auf gestischer Ebene der Fall (vgl. etwa 
Kita/Özyürek 2003 zu Pendelbewegungen), und der Unterschied zwischen verb- 
rahmenden (‚verb-framed‘) und satellitenrahmenden (,satellite-framed‘) Spra- 
chen bei der Beschreibung von Bewegungen spiegelt sich auch in der Gestik wi- 
der, ähnlich wie die Tendenz einer Sprache, in Bewegungsverben entweder öfter 
die Art und Weise der Bewegung oder den Weg bzw. die Richtung mitzukodieren 
(vgl. Müller 1998). Zusammenfassend ließe sich mit Müller (1998: 231) festhalten, 
dass es also gute Gründe gibt, von einzelsprachspezifischer Gestik auszugehen, 
wenngleich vor vorschnellen Schlussfolgerungen gewarnt sei (das Stereotyp, 


3 Möglicherweise könnte man mit Cienki (2015) von unterschiedlichen Graden der ‚Sprachlich- 
keit‘ der Gesten ausgehen. Allerdings handelt es sich dabei m. E. eher um unterschiedliche Ver- 
hältnisse zwischen Gesten und verbalen Elementen ohne Auswirkungen auf die Annahme, dass 
Gesten sprachliche Elemente sind. 


62 —— Multimodalität 


dass Spanier mehr gestikulieren als Deutsche, wird zum Beispiel von Müller wi- 
derlegt). Jedoch ist diese gegenseitige Verwobenheit von Gestik und Verbalem m. 
E. stark genug um, gemeinsam mit den anderen angesprochenen Beobachtun- 
gen, im Anschluss an u. a. Kendon (1988: 131) und McNeill (1992: 2) zu behaupten, 
dass Gestik Teil der Sprache ist, und dass mit anderen Worten ‚Sprache‘ die Be- 
zeichnung des Matrixcodes ist. 

Für diese Auffassung von Gestik als Teil der Sprache spricht auch die zuneh- 
mend vertretene Ansicht, dass sich (gesprochene) Sprache, d. h. Sprache im 
Sinne von verbal Geäußertem, aus Gestik entwickelt habe (u. a. McNeill 2012, Ar- 
bib 2013, Corballis 2013).* In dieser Hinsicht ist auch bemerkenswert, dass For- 
scher wie Wilcox (2004) einen breiteren Gestikbegriff vorschlagen, der auch die 
artikulatorischen Bewegungen beim Sprechen umfasst. Diese Diskussion kann 
im Rahmen der vorliegenden Arbeit nicht weiter geführt werden; sie zeigt jedoch 
abermals die enge Verwobenheit von Gestik mit der verbalen Ebene. 

Schließlich sei im Lichte der obigen Darlegungen noch eine terminologische 
Anmerkung gemacht. In vorliegender Arbeit werden die Bezeichnungen ‚verbal‘ 
und ‚sprachlich‘ nicht synonym verwendet. ‚Verbal‘ bezieht sich auf die Ebene 
des tatsächlich in Worten Geäußerten (was im Englischen als ‚speech‘ bezeichnet 
wird), ‚sprachlich‘ (bzw. ‚linguistisch‘) dagegen auf die Ebene des Matrixcodes 
‚Sprache‘ (im Englischen ‚language‘). In der Hinsicht lässt sich Gestik durchaus 
als nonverbal einstufen, contra Müller (1998) und Bohle (2007), die der Meinung 
sind, Nonverbalität impliziere Nichtsprachlichkeit und dementsprechend eine zu 
starke Trennung der Gestik vom Verbalen bzw. von Sprache (vgl. auch schon 
McNeill 1985). Im Hinblick auf die Integration in den Matrixcode ‚Sprache‘ ist eine 
solch starke Trennung nicht wünschenswert; daher wird in vorliegender Arbeit 
Gestik durchaus als sprachlich eingestuft, aber trotzdem als nonverbal, da sich 
dieser Begriff hier nur auf die gesprochenen Worte bezieht. Nichtsprachlich sind 
lediglich diejenigen Kommunikationsmodi, die nicht in den Matrixcode ‚Sprache‘ 
integriert sind und mithin in einer multimedialen (statt einer multimodalen) Ana- 
lyse zu erfassen sind. 


4 McNeill (2013) nuanciert allerdings dieses Bild und gibt an, Sprache habe sich nicht einfach 
aus Gestik entwickelt, sondern es sei vielmehr von einer gemeinsamen Entwicklung der sprach- 
lichen Ausdrucksebenen (Verbales und Gestik) in enger Interaktion miteinander auszugehen. 
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3.3.3 Gestikeinteilung 


Das Hauptanliegen der vorliegenden Arbeit ist das Beschreiben der Kookkurrenz- 
muster im Gebrauch von Gesten und Modalpartikeln. Dementsprechend sollen 
die relevanten Gesten auch an erster Stelle nach ihrem Verhältnis zur verbalen 
Abtönung eingeteilt werden (vgl. Kapitel 10). Diese Einteilung sagt jedoch wenig 
über die Natur der Gesten selber aus. Zudem können auf den einzelnen Dimensi- 
onen dieser abtönungsliierten Einteilung durchaus Gesten anzusiedeln sein, die 
herkömmlicherweise unterschiedlichen Gestentypen zugeordnet werden. In der 
Hinsicht ist es für die Beschreibung der relevanten Gestikmuster nützlich, wenn 
sie mit traditionellen Gestenkategorien verknüpft werden können. Daher sei an 
dieser Stelle noch kurz auf die Kategorisierungsfrage eingegangen. 

In der Literatur sind bereits mehrere Gestikeinteilungen vorgeschlagen wor- 
den, die sich zum Teil ähneln, zum Teil aber auch erheblich voneinander unter- 
scheiden.’ Im Folgenden soll an erster Stelle die von McNeill (1992, 2005) ausge- 
arbeitete Einteilung als Ausgangspunkt genommen werden, auch wenn Fricke 
(2012, u.a. S. 169 und 180) darauf hinweist, dass diese - genauso wie auch andere 
gängige Klassifizierungen - gewisse Unvollkommenheiten aufweist. Dass trotz- 
dem von dieser Einteilung ausgegangen wird, lässt sich dadurch erklären, dass 
sich die von McNeill unterschiedenen Kategorien bzw. Dimensionen für die Be- 
schreibungen im Analyseteil dieser Arbeit durchaus als geeignet herausstellen 
und zudem ein gutes Bild der Dimensionen liefern, an denen sich die Gestikfor- 
schung heutzutage am ehesten orientiert (auch wenn sie gelegentlich anders ge- 
nannt und zum Teil auch leicht anders konzeptualisiert werden). 

Bezieht man die Embleme mit ein (vgl. Abschnitt 3.3.1), so lassen sich im An- 
schluss an McNeill im Großen und Ganzen fünf Dimensionen bzw. Arten von Ges- 
ten unterscheiden: neben den Emblemen auch die ikonischen, metaphorischen 
und deiktischen Gesten sowie die Taktstockgesten. Die ikonischen und metapho- 
rischen Gesten werden manchmal unter der Bezeichnung ‚referentielle Gesten‘ 
zusammengeführt (u. a. von Müller 1998°, aber auch schon von McNeill 1985 sel- 
ber), da sie deutlicher als die anderen Gestentypen einen Referenten darstellen 


5 Eine aktuelle und kritische Übersicht der wichtigsten Klassifikationssysteme liefert Fricke 
(2007: 156-220); ähnlich auch u.a. Kendon (2004: 84-104) und Müller (1998: 91-103). 

6 Laut Müller (1998: 110) dürften allerdings auch bestimmte Embleme als referentielle Gesten 
zu betrachten sein. 
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bzw. aufihn hinweisen (‚referieren‘).’ Tatsächlich sind die ikonischen wie die me- 
taphorischen Gesten im Rahmen der Zeichentheorie von Peirce? als ikonisch ein- 
zustufen, während die anderen Gestiktypen vielmehr als indexikal oder symbo- 
lisch zu betrachten sind. Aus diesem Grund werden die ikonischen und die 
metaphorischen Gesten manchmal auch gemeinsam unter dem Nenner ‚iko- 
nisch‘ geführt (u. a. von de Ruiter 2003, der zwar nicht explizit auf Peirce hin- 
weist, allerdings ein gleichlaufendes Argument verwendet). Da aber für die vor- 
liegende Analyse der Unterschied ikonisch/metaphorisch durchaus relevant ist, 
seien sie hier trotzdem als zwei unterschiedliche Dimensionen betrachtet, und 
die Bezeichnung ‚ikonisch‘ wird im Anschluss an u. a. McNeill (1992, 2005) den 
nichtmetaphorischen Gesten vorbehalten. 

Als ikonisch werden somit Gesten eingestuft, die konkrete Entitäten oder Hand- 
lungen repräsentieren: Bestimmte Eigenschaften oder Aspekte der Entität bzw. 
der Handlung werden gestisch realisiert, sodass die Geste die Entität oder Hand- 
lung sozusagen darstellt. Ikonische Gesten weisen also eine enge förmliche Be- 
ziehung zu einem konkreten Element in der verbalen Äußerung auf. Ein Beispiel 
ist die Geste in Abbildung 2. Der Sprecher (links im Bild) sagt hier, man solle für 
eine bestimmte Zimmerpflanze einen großen Blumentopf nehmen, und hält zu- 
gleich die Hände so, als hielte er tatsächlich einen großen Blumentopf. Die Geste 
repräsentiert also den großen Topf (indem sie ihn gewissermaßen ‚begrenzt‘) 
bzw. das Nehmen dieses Topfes. Ebenfalls ikonisch ist die gestische Darstellung 
von Klavierspielen oder Maschinenschreiben, wenn man die beiden Hände mit 
gestreckten und leicht gespreizten Fingern vor sich hält, die Handflächen nach 
unten gerichtet, und die Finger einzeln auf und ab bewegt, so als drücke man 
tatsächlich auf die Tasten eines Klaviers. Da ikonische Gesten typischerweise di- 
rekt mit einem konkreten Element aus der verbalen Äußerung im Zusammenhang 
stehen (vgl. McNeill 1992: 12), ist zu erwarten, dass sie für die Analyse von Modal- 
partikeln, die selber nicht auf konkrete Handlungen oder Entitäten verweisen, 
eine geringere Rolle spielen. 


7 Andere Bezeichnungen sind ‚lexikalische Gesten‘ (Kraus et al. 2000) und ‚repräsentationelle 
Gesten‘ (Coletta et al. 2009). Allerdings wird letzterer Begriff gelegentlich (u. a. von Kita 2000: 
162) breiter definiert und umfasst dann auch die abstrakt-deiktischen Gesten. 

8 Zu Peirces Zeichentheorie: siehe u. a. Short (2007) und spezifisch für Gestik u. a. Fricke (2007: 
182-205) und Mittelberg (2008). 
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Abb. 2: Ikonische Geste ‚großer Topf‘ (FG_B1a) 


Metaphorischen Gesten wird eine ähnliche repräsentierende Wirkung zuge- 
schrieben. Allerdings repräsentieren metaphorische Gesten nicht direkt dasje- 
nige, was dargestellt werden soll, sondern das Darzustellende wird metaphorisch 
in eine andere Domäne übertragen.” Ein typisches Beispiel ist die sogenannte 
‚Conduit‘-Metapher, bei der zum Beispiel ein Gespräch (d. h. ein Austausch von 
Äußerungen) als ein Austausch von konkreten Objekten dargestellt wird. Die 
sprachlichen Äußerungen werden mit anderen Worten verdinglicht. Die dazuge- 
hörige Geste ist mit der ikonischen Geste des Anbietens eines Objektes identisch, 
repräsentiert jedoch nicht das reale Bieten, sondern steht vielmehr metaphorisch 
für das Äußern (bzw. Bieten) der Äußerung bzw. ihres Inhalts. Eine ausführli- 
chere Darstellung dieser ‚Conduit‘-Geste erfolgt in Abschnitt 10.2. 

Zu dieser Umschreibung seien allerdings zwei Anmerkungen gemacht. Zum 
einen ist Fricke (2007: 180) beizupflichten, wenn sie behauptet, dass McNeill in 
seiner Darstellung „in dem Irrtum befangen“ scheint, dass metaphorische Gesten 
immer auf Abstraktes hinweisen. Tatsächlich wird bei Metaphern (verbal wie ges- 
tisch) typischerweise eine konkrete Domäne auf eine abstrakte übertragen, aber 
es ist durchaus auch möglich, Konkretes auf Konkretes zu übertragen (vgl. auch 
u. a. Cienki/Müller 2008: 485-486). Wenn man zum Beispiel eine Person gestisch 
als einen Esel darstellt (indem man mit den Fingern Eselsohren nachahmt), so 
metaphorisiert man durchaus eine konkrete Entität bzw. in diesem Fall eine Per- 
son (Beispiel von Fricke a. a. O.). 


9 In der Hinsicht ist Müller (1998: 110f.) und Kendon (2004: 170) beizutreten, die der Meinung 
sind (contra McNeill), dass das Metaphorische einer solchen Geste nicht darin bestehe, dass sie 
selber eine Metapher abbilde, sondern vielmehr darin, dass sie nur vor dem Hintergrund einer 
ihr zugrundeliegenden Metapher zu interpretieren sei. 
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Die zweite Anmerkung betrifft die Einstufung metaphorischer Gesten durch 
McNeill (1992: 14) als bildhaft (‚pictorial‘) bzw. repräsentierend. Tatsächlich sind 
einige Gesten, die auf einer Metapher basieren, nicht gerade als bildhaft einzu- 
stufen. Ein Beispiel ist das nach hinten zeigen, wenn man über Vergangenes 
spricht (vgl. Abbildung 3). Wiedergegeben wird hier also das Bild, dass die Ver- 
gangenheit hinter uns liegt, eine der möglichen Instanziierungen der Metapher 
ZEIT IST RAUM. Wenn diese Geste die Form einer Zeigegeste hat, so liegt ihr eine 
deiktische vielmehr als eine repräsentierende Darstellung zugrunde. 


Abb. 3: Metaphorische Geste ‚gestern‘ (FG_B1a) 


Die deiktischen Gesten bzw. Zeigegesten bilden an sich auch eine eigene Ges- 
tenkategorie. Als typische Realisierung des Zeigens in westlichen Kulturen gilt 
vielfach das Zeigen mit einem Finger (7°) auf ein Objekt. Allerdings ist dies nicht 
die einzig mögliche Form des Zeigens. Wie Wilkins (2003) gezeigt hat, ist zum 
Beispiel bei den Arrernte, einem australischen Aboriginal-Stamm, das Fingerzei- 
gen nicht die prototypische Zeigegeste, sondern nur eine von vielen. Auch im 
Deutschen sind unterschiedliche Realisierungen der Zeigegeste möglich, wie es 
Fricke (2007: 155) anmerkt:'° 


Die Zeigegeste als redebegleitende Geste ist durch eine große Formvariabilität gekennzeich- 
net. Die deiktische Funktion des hinweisenden Zeigens ist nicht an die tendenziell konven- 
tionalisierte Form der typischen Zeigefingergeste gebunden. So können als zeigende Finger 
auch alle anderen Finger auftreten [...], ebenso wenig ist die Anzahl der zeigenden Finger 
festgelegt. Es können beispielsweise auch zwei Finger an der Zeigegeste beteiligt sein oder 


10 Vgl. auch Kendon (2010: 20). Illustriert wird diese Vielfalt auch schon in Abbildung 3: Der 
Sprecher verwendet hier den Daumen zum Zeigen - was im Allgemeinen typisch ist, wenn man 
hinter sich zeigt (vgl. fürs Neapelitalienische Kendon/Versante 2003: 121). 
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die ganze Handfläche, auch andere Körperteile als die Hände können eine hinweisende 
Funktion erfüllen [...]. 


Ähnlich groß wie die Formenvielfalt der Zeigegesten ist auch die Vielfalt auf 
Funktionsebene (vgl. u. a. Leroy et al. 2009). Dabei gibt es bestimmte Tendenzen, 
mit welcher Form bestimmte Funktionen einhergehen (vgl. Kapitel 8 zu den in- 
tersubjektiven Deiktika sowie Kendon/Versante 2003), aber ein klares Eins-zu- 
eins-Verhältnis ist nicht nachzuweisen. Was die Funktion betrifft, sind für die 
vorliegende Arbeit zwei Gruppen von Zeigegesten von besonderer Relevanz: zum 
einen die referentiellen Deiktika, zum anderen die sogenannten interaktiven oder 
intersubjektiven Deiktika." 

Referentielle Deiktika sind Zeigegesten, die dazu eingesetzt werden, auf eine 
konkrete Entität (Person oder Objekt) hinzuweisen, um diese als gemeinten Refe- 
renten des gesagten zu identifizieren oder um die Aufmerksamkeit des Ge- 
sprächspartners darauf zu lenken (u. a. Mondada 2014). Typischerweise handelt 
es sich dabei um eine tatsächlich vor Ort anwesende und wahrnehmbare Entität. 
Allerdings ist es auch möglich, auf eine ‚abwesende‘ Entität hinzuweisen, indem 
man in der Richtung zeigt, in der die Entität zu finden ist (zum Beispiel in der 
Richtung des Büros eines Kollegen, wenn der Kollege gemeint ist), oder indem 
man der Entität stellvertretend einen Platz im Gestikraum zuweist. McNeill (2005: 
40) schlägt vor, im Falle eines abwesenden Referenten von abstrakten, ansonsten 
von konkreten Zeigegesten zu sprechen.” 

Varianten dieses referentiellen Deiktikums sind sogenannte informative Zei- 
gegesten, bei denen nur eine Richtung angezeigt wird (allerdings ohne damit di- 
rekt auf einen Referenten hinzudeuten), und sogenannte imperativische Zeigege- 
sten, die vor allem von Kindern verwendet werden, um zu vermitteln, dass man 
das Angezeigte haben möchte, und mit anderen Worten eine Person dazu aufzu- 
fordern, das Angezeigte anzureichen. Diese Varianten sind jedoch für die vorlie- 
gende Arbeit von geringerer Wichtigkeit. 

Anders als referentielle Deiktika sind intersubjektive Deiktika Zeigegesten, 
die auf den Gesprächspartner als Interaktant in der Kommunikation gerichtet 
sind. Sie haben keine primär referentielle Funktion, sondern dienen vielmehr 


11 Weitere Funktionen der Zeigegesten, etwa bei der Verteilung des Rederechtes sowie bei der 
Diskusstrukturierung (s. u. a. Bohle 2007, Mondada 2007 und Schmitt 2003), sind für die vorlie- 
gende Arbeit von geringerer Relevanz und bleiben deshalb außer Betracht. 

12 Gelegentlich (insbesondere in der Gebärdensprachforschung) wird statt von konkreten und 
abstrakten Deiktika auch von exo- und endophorischen Zeigegesten gesprochen (u. a. Vermeer- 
bergen/Demey 2007: 272). 
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dazu, geteiltes Wissen oder Übereinstimmung bzw. Einverständnis mit der Per- 
son, auf die die Geste gerichtet ist, anzudeuten. Ausführlichere Besprechungen 
der referentiellen und intersubjektiven Deiktika erfolgen in den Kapiteln 8 und 
10.1. 

Beats oder Taktstockgesten sind Gesten, bei denen ein Körperteil eine Hin- 
und-her-Bewegung beschreibt, die mehr oder weniger parallel zum Sprechrhyth- 
mus verläuft. Typischerweise handelt es sich um eine Handbewegung, obwohl es 
durchaus möglich erscheint, auch etwa mit dem Kopf einen Beat zu realisieren 
(vgl. dazu Abschnitt 9.1). In den meisten Fällen handelt es sich um eine Auf-und- 
ab-Bewegung, obwohl auch andere Dimensionen als die senkrechte vertreten 
sein können. Im Allgemeinen werden Taktstockgesten dazu eingesetzt, das zu- 
gleich Gesagte hervorzuheben bzw. zu betonen. Allerdings können Beats auch 
leicht mit einer anderen Geste kombiniert werden und können in dem Fall eher 
der Hervorhebung der anderen Geste als des Gesagten dienen. Dementsprechend 
ist auch die Handform bei Beats nicht im Voraus festgelegt; es kann auch sein, 
dass die Hand einfach die Form behält, in der sie zu Anfang der Beatgeste gerade 
ist (vgl. Hinnell 2013). 

Auf den letzten anzusprechenden Gestentyp wurde oben bereits hingewie- 
sen. Es handelt sich um die Embleme. Embleme unterscheiden sich von anderen 
Gesten in der Hinsicht, dass sie stärker konventionalisiert sind. Auf der Bedeu- 
tungsebene zeigt sich das darin, dass sie, was die Interpretation betrifft, weniger 
vom Kontext bzw. vom verbal Geäußerten abhängig sind.” Ähnlich ist auch ihre 
Form kontextunabhängig und ziemlich bis völlig verfestigt, während andere Ges- 
ten mehr Variation erlauben. Das Emblem des Schweigens, zum Beispiel, wird 
realisiert, indem man den Zeigefinger senkrecht direkt vor dem geschlossenen 
Mund hält; wenn man es mit dem Ringfinger macht, den Finger waagerecht hält, 
oder ihn zwanzig Zentimeter vom Mund entfernt hält, so wird dies als seltsam 
erfahren, oder das Emblem wird gar nicht erst erkannt. Andererseits weiß jeder, 
der das Emblem kennt, sofort, was es bedeutet, ohne das weiter Gesagte berück- 
sichtigen zu müssen. Weitere Embleme sind nicken (,ja‘), den Kopf schütteln 
(‚nein‘), den Daumen hoch- (‚prima‘) bzw. runterhalten (‚schlecht‘), den Zeige- 
finger an die Stirn tippen (‚der spinnt wohl‘) usw. 


13 Allerdings darf die Kontextunabhängigkeit auf Bedeutungsebene nicht allzu absolut postu- 
liert werden. Nicht nur wäre dies aus kognitiv-linguistischer Sicht fraglich, da Bedeutung immer 
Konzeptualisierung im Rahmen einer Gebrauchssituation ist (vgl. Langacker 1987: 401); in eini- 
gen Fällen sind Embleme auch nicht ganz ohne Berücksichtigung des Kontextes zu interpretie- 
ren, etwa im Falle polysemer (oder homonymer) Embleme (vgl. dazu Calbris 2005: 53). 
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Ursprünglich listete McNeill (1992) noch zwei weitere Gestentypen auf, die 
allerdings in seiner Einteilung etwas abseits standen: Kohäsionsgesten und so- 
genannte Butterworths. Unter Kohäsionsgesten versteht McNeill Gesten, die die 
Kohäsion einer Ausführung unterstreichen sollen. Die Wiederholung der Geste 
(bzw. die Beibehaltung eines Aspektes der Gestenform in aufeinanderfolgenden 
Gesten, vgl. McNeill/Levy 1993) markiere, so McNeill (1992: 16), „the recurrence 
or continuation of a theme“, und formal könnten sie aus allen anderen Gestikka- 
tegorien stammen, von ikonisch über deiktisch bis zum Beat. In dieser Hinsicht 
könnte man sich mit Fricke (2007: 169) fragen, was der Mehrwert dieser Kategorie 
ist, da sie nicht wirklich neben den anderen Gestentypen zu stehen scheint son- 
dern eher eine mögliche Verwendung bestimmter Gesten unterschiedlicher Kate- 
gorien darstellt. Tatsächlich scheint es sich m. E. eher um Kohäsion in der Gestik 
zu handeln, d. h. um Gestikkohäsion (die ihrerseits auf Kohäsion auf der verbalen 
Ebene deutet), und nicht um Kohäsionsgestik. 

Butterworths dagegen sind Gesten, die realisiert werden, wenn der Sprecher 
mit Formulierungsschwierigkeiten kämpft. Da Butterworths, ähnlich wie Emb- 
leme, nicht unbedingt zeitgleich mit verbalen Elementen geäußert werden, sind 
es für McNeill keine prototypischen Fälle von ‚gesticulation‘. Sie sind aber trotz- 
dem als ko-verbal zu betrachten (vgl. Abschnitt 3.3.1), und sollen dementspre- 
chend in vorliegender Arbeit nicht ausgegrenzt werden. Es gibt allerdings einen 
anderen Grund, Butterworths nicht als separate Kategorie zu behalten: Typische 
Butterworths sind auch in der Kategorie der metaphorischen Gesten oder der 
Embleme unterzubringen. Der prototypische Butterworth laut McNeill (1992: 77), 
zum Beispiel, ist die Geste, bei der der Sprecher das gesuchte Wort aus der Luft 
zu greifen bzw. zu pflücken versucht. In der Hinsicht wird die Suche nach dem 
richtigen Wort metaphorisch als das Pflücken einer Frucht dargestellt, obwohl 
man sich fragen könnte, ob es sich nicht mittlerweile zu einem Emblem entwi- 
ckelt hätte. Ähnlich ist das Kopfschütteln während einer Wortsuche - ein Bei- 
spiel, das McNeill nicht erwähnt - auch als Emblem einzustufen (vgl. Abschnitt 
7.3.3). Aus diesem Grund werden im Folgenden die Butterworths nicht als sepa- 
rater Gestentyp betrachtet. 

Schließlich ist noch darauf hinzuweisen, dass es sich bei den aufgelisteten 
Gestentypen nicht um streng abgegrenzte Kategorien handelt (obwohl diese Be- 
zeichnung auch oben verwendet wurde), sondern vielmehr um Dimensionen. 
Wichtig ist dabei, einzusehen, dass eine Geste auf mehreren Dimensionen anzu- 
siedeln sein kann bzw. mehrere Dimensionen in sich vereinen kann. Oben wurde 


14 Dass sich Embleme vielfach aus metaphorischen Gesten entwickelt haben, hat McNeill (2012: 
8-9) bereits angedeutet. 
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bereits auf metaphorische Gesten hingewiesen, die von der Realisierungsform 
her eigentlich Zeigegesten sind, sowie auf Beats, die andere Gesten überlagern 
und mehr oder weniger mit diesen anderen Gesten verschmelzen. Ähnlich ist es 
auch möglich, dass die ‚Conduit‘-Metapher und das intersubjektive Deiktikum in 
einer einzigen Geste realisiert werden (vgl. Kapitel 8). Diese Situation der Kombi- 
nation von Dimensionen sei Fricke (2007: 169) zufolge ein Nachteil der Einteilung 
von McNeill, zumal er nicht angebe, wie der Begriff ‚Dimension‘ genau zu inter- 
pretieren sei. Letzteres ist sicher richtig. Allerdings ist nicht auf Anhieb klar, 
wieso die Arbeit mit Dimensionen statt Kategorien per definitionem ein Nachteil 
sein sollte, zumal streng abgegrenzte Kategorien sowieso eher den Ausnahmefall 
darstellen (vgl. auch die Diskussion im vorigen Kapitel). Außerdem ist für einige 
der gerade erwähnten Beispiele auch in Frickes alternativer Einteilung eine Ein- 
ordnung in einer bestimmten Kategorie nicht möglich (etwa für die Kombination 
von ‚Conduit‘ und intersubjektivem Deiktikum). Daher wird im Folgenden durch- 
aus mit der gängigeren Einteilung McNeills gearbeitet - allerdings unter Berück- 
sichtigung der oben gelieferten Anmerkungen. 


4 Konstruktionen 


4.0 Einführung 


Zwei der drei Kernbegriffe der vorliegenden Arbeit, ‚Modalpartikeln‘ und ‚multi- 
modal‘, wurden bereits erläutert. Wenn man jedoch Modalpartikeln als multimo- 
dale Konstruktionen besprechen möchte, so muss man sich auch darüber im Kla- 
ren sein, was unter dem Begriff ‚Konstruktion‘ verstanden wird. Tatsächlich darf 
nicht einfach vorweggenommen werden, dass gleich einleuchtet, was genau mit 
diesem Begriff gemeint ist, denn er ist in unterschiedlichen linguistischen Denk- 
rahmen mit unterschiedlichen Bedeutungen verwendet worden. Sogar die An- 
gabe, dass die vorliegende Arbeit im Rahmen der Konstruktionsgrammatik anzu- 
siedeln ist, impliziert noch nicht, dass klar ist, wie der Konstruktionsbegriff zu 
interpretieren ist: Auch innerhalb der Konstruktionsgrammatik sind mehrere 
Strömungen zu unterscheiden, die zum Teil mit unterschiedlichen Auffassungen 
des Konstruktionsbegriffs arbeiten. Daher soll im Folgenden kurz auf diese Vari- 
ation im Konstruktionsbegriff eingegangen und eine Situierung der vorliegenden 
Arbeit in diesem Feld der Konstruktionsgrammatik vorgenommen werden (4.1), 
bevor ein kurzer Überblick der bisherigen konstruktionsgrammatischen Arbeit zu 
Modalpartikeln (4.2) wie zur Multimodalität (4.3) geliefert wird. 


4.1 Konstruktionen und die Konstruktionsgrammatik 


Im Grunde genommen ist ‚Konstruktionsgrammatik‘ ein Oberbegriff, unter dem 
sich mehrere eng verwandte linguistische Strömungen vereinen. Eine detaillierte 
Übersicht aller dieser Strömungen würde den Rahmen der vorliegenden Arbeit 
sprengen; daher sei im Folgenden vor allem auf die Gemeinsamkeiten sowie auf 
die wichtigsten Unterschiede eingegangen. Weiterführende Darstellungen der 
Vielfalt an ‚Konstruktionsgrammatiken‘ finden sich bei Ziem/Lasch (2013) sowie 
in etwas beschränkterer Form u. a. bei Fischer/Stefanowitsch (2007), Birkner 
(2008: 287-290) und Traugott/Trousdale (2013: 2-8). Im Folgenden werden zu- 
nächst einige Anmerkungen zum Konstruktionsbegriff selber gemacht (4.1.1), be- 
vor auf die weiteren Prämissen bzw. Grundthesen der Konstruktionsgrammatik 
eingegangen wird (4.1.2). 
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4.1.1 Der Konstruktionsbegriff 


Das wichtigste Prinzip der Konstruktionsgrammatik, dem sie zugleich ihren Na- 
men verdankt, ist die These, dass die Haupteinheit von Sprache die Konstruktion 
ist. Um diesen Begriff zu erläutern, wird vielfach auf Goldbergs (1995: 4) Defini- 
tion Bezug genommen: 


Cis a construction iffaer C is a form-meaning pair <Fi,Si> such that some aspect of Fi or some 
aspect of Si is not strictly predictable from C’s component parts or from other previously 
established constructions. 


Schon in dieser Definition, die an sich ziemlich einfach und kurz gefasst ist, 
zeigt sich allerdings ein Punkt der Uneinigkeit zwischen den Konstruktionsgram- 
matikern. Goldberg gibt hier an, dass eine Konstruktion prinzipiell nicht ganz 
kompositionell ist. Dies wird nicht in allen Zweigen der Konstruktionsgrammatik 
als Bedingung betrachtet, um von einer Konstruktion sprechen zu können. Lang- 
acker (1987), zum Beispiel, lehnt als Vertreter der sogenannten ‚Cognitive 
Grammar‘ die Nichtkompositionalität als Definitionsmerkmal explizit ab.' Damit 
schließt er allerdings die Existenz nichtkompositioneller Konstruktionen nicht 
von vornherein aus; er betrachtet die Nichtkompositionalität nur nicht als grund- 
legendes Kriterium: Es kann sowohl kompositionelle als auch nichtkompositio- 
nelle Konstruktionen geben. Letztere Ansicht hat mittlerweile an Boden gewon- 
nen (Stefanowitsch 2011: 184, vgl. auch Bücker 2012: 81), und auch Goldberg 
(2006: 5) selber hat ihren Konstruktionsbegriff daraufhin geändert, dass Nicht- 
kompositionalität keine zwingende Voraussetzung mehr ist: 


Any linguistic pattern is recognized as a construction as long as some aspect of its form or 
function is not strictly predictable from its component parts or from other constructions 
recognized to exist. In addition, patterns are stored as constructions even if they are fully 
predictable as long as they occur with sufficient frequency |...]. 


Auch in vorliegender Arbeit wird die Ansicht vertreten, dass Konstruktionen 
durchaus kompositionell sein können, obwohl viele Konstruktionen es nicht sind 
(vgl. Langacker 1987: 464). 


1 Obwohl die ‚Cognitive Grammar‘ nicht immer als Zweig der Konstruktionsgrammatik aufge- 
listet wird, basiert sie auf dem Hauptmerkmal der Konstruktionsgrammatik (die Haupteinheit 
von Sprache ist eine symbolische Paarung von Form und Bedeutung, vgl. unten), sodass sie 
durchaus als konstruktionsgrammatische Strömung betrachtet werden kann (vgl. u. a. Lang- 
acker 2005). 
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Der andere Aspekt der ursprünglichen Definition Goldbergs, der in der neu- 
eren Formulierung weniger explizit erwähnt wird (allerdings durchaus noch im- 
pliziert ist), ist weniger kontrovers. Ganz im Gegenteil: Es handelt sich um die 
Hauptidee des Konstruktionsbegriffs: Eine Konstruktion ist eine symbolische 
Paarung von Form und Bedeutung. Im Anschluss an Croft (2001) hat Depper- 
mann (2006a: 53) dies schematisch wie folgt dargestellt: 


syntaktische Eigenschaften 
morphologische Eigenschaften 
phonologische Eigenschaften 


semantische Eigenschaften 
pragmatische Eigenschaften 
diskursfunktionale Eigenschaften 


Abb. 4: Konstruktion (nach Deppermann 2006a: 53) 


Das äußere Rechteck repräsentiert in diesem Schema die Konstruktion, während 
die inneren Rechtecke für die Form (oben) und die Bedeutung (unten) stehen. 
Verbunden werden die beiden inneren Rechtecke durch eine gestrichelte Linie, 
die ihrerseits die symbolische Verknüpfung von Form und Bedeutung darstellt. 
Was die Bedeutungsseite der Konstruktion betrifft, fällt auf, dass außer den 
traditionellen Bedeutungsebenen der Semantik und der Pragmatik auch die dis- 
kursfunktionale Ebene enthalten ist. Tatsächlich wird in der Konstruktionsgram- 
matik im Allgemeinen von einem breiten Bedeutungskonzept ausgegangen’, der 
auch solche Aspekte enthält, die intuitiv vielleicht eher als Funktion einer Form 
denn als ihre Bedeutung im klassischen Sinne einzustufen wären (vgl. Stefano- 
witsch 2011: 183). In diesem Sinne sind auch nichtpropositionale Partikelbedeu- 


2 Vor allem bei den eher formal-generativ orientierten Zweigen der Konstruktionsgrammatik 
dürfte dies jedoch weniger offensichtlich sein, da sie in ihren Attribut-Wert-Matrizen bzw. -Käs- 
ten für die Bedeutung vielfach nur das Label sEM (für ‚semantics‘) verwenden - vgl. Ziem/Lasch 
(2011: 279) sowie auch die Darstellung der Bedeutung von Konstruktionen bei Wildgen (1990: 82) 
und u. a. die Beschreibungen der ‚Berkeley Construction Grammar‘ und der ‚Sign-Based 
Construction Grammar‘ bei Fillmore (2013) und Michaelis (2013). 
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tungen sowie die illokutionstypbezogene Wirkung von Modalpartikeln (vgl. Ka- 
pitel 2) unter diesem Nenner der ‚Bedeutung‘ zu fassen. Wichtig ist zudem, dass 
auch der Skopus Teil dieses breiten Bedeutungskonzeptes ist. Wenn von der Be- 
deutung einer Konstruktion die Rede ist, so umfasst dies also nicht nur die Be- 
deutung, die von der Konstruktion selber vermittelt wird (im weitesten Sinne), 
sondern auch ihren Wirkungsbereich bzw. ihren Skopus. 

Weniger einheitlich sind die Ansichten, was die Formseite betrifft. Wie Ab- 
bildung 4 zeigt, siedelt Deppermann (2006a: 53) im Anschluss an Crofts (2001) 
sogenannte Radical Construction Grammar auf der Formseite sowohl Phonologi- 
sches als auch Morphologisches und Syntaktisches an. Ähnlich ist Imo 
(2011b: 117) der Meinung, bei der Beschreibung einer Konstruktion sollten alle re- 
levanten Ebenen in Betracht gezogen werden, und Günthner (2009: 404) um- 
schreibt die Konstruktionsgrammatik „in sämtlichen Ausprägungen“ als eine 
„integrative (d. h. alle Ebenen der sprachlichen Strukturierung erfassende) Gram- 
matiktheorie.“ Allerdings scheint das Prädikat „in sämtlichen Ausprägungen“ 
nicht ganz zuzutreffen. Das Einbeziehen der Ebene der grammatischen Form, 
zum Beispiel, das in den meisten Zweigen der Konstruktionsgrammatik als nor- 
mal gilt (auch u. a. Goldberg [1995: 51] spricht von einem „syntactic level of gram- 
matical functions“), wird von Langacker (u. a. 2005) explizit abgelehnt. Für ihn 
umfasst die Formseite einer Konstruktion nur die sogenannten symbolisierenden 
(‚symbolizing‘, Langacker 2005: 104) Ausdrucksebenen, die er unter dem Nenner 
‚phonological structure‘ zusammenführt. Allerdings stellt sich diese Einschrän- 
kung insbesondere für schematischere Konstruktionen (vgl. unten) als problema- 
tisch heraus, da die Formseite in dem Fall für die Bestimmung der Konstruktion 
zu abstrakt ist (vgl. Verhagen 2009). Dementsprechend wird in der vorliegenden 
Arbeit auch die morphosyntaktische Ebene als Teil des Konstruktionsbegriffs be- 
trachtet. 

Dass er die grammatische Form von der Konstruktion ausschließt, heißt je- 
doch nicht, dass sich Langacker auf Phonologisches beschränkt. Tatsächlich ver- 
einen sich unter dem Nenner ‚phonological structure‘ alle symbolisierenden Ebe- 
nen. Selber formuliert es Langacker (2008: 15) folgendermaßen: 


Under the rubric phonological structure, I include not only sounds but also gestures and 
orthographic representations. Their essential feature is that of being overtly manifested, 
hence able to fulfill a symbolizing role. 


Diese Beobachtung ist für die vorliegende Arbeit nicht unwichtig, da sie eine Öff- 
nung zu multimodalen Größen (und insbesondere zur im Folgenden zu analysie- 
renden Gestik) schafft. Damit ist Langacker einer der Wenigen, die in einem pro- 
grammatischen Rahmen die Möglichkeit multimodal ausgerichteter konstruk- 
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tionsgrammatischer Analysen anspricht’, obwohl er selber in seinen eigenen Ar- 
beiten monomodal vorgeht und die verbale Ebene fokussiert. Da vorliegende Ar- 
beit multimodal orientiert ist, soll es nicht wundern, dass die Möglichkeit offen 
gehalten wird, dass multimodale Größen in die Formseite der Konstruktion inte- 
griert werden. Auf diese Frage soll jedoch weiter unten (Abschnitt 4.3 und Kapitel 
14) ausführlicher eingegangen werden. 

Wenngleich die Form und die Bedeutung einer Konstruktion ihre wichtigsten 
Komponenten darstellen, so ist die Konstruktion noch nicht gänzlich beschrie- 
ben, wenn man nur darauf hinweist. Ein weiterer inhärenter Teil einer Form ist 
ihre Verwendung, d. h. wie und unter welchen Bedingungen sie eingesetzt wird 
bzw. werden kann/muss (oder eben nicht). Besonders in kognitiv-funktional aus- 
gerichteten linguistischen (aber nicht nur konstruktionsgrammatischen) Denk- 
rahmen ist die Ansicht gewachsen, dass eine sprachliche Struktur nicht analy- 
siert werden kann, ohne der Frage nachzugehen, wie sie gebraucht wird. Linell 
(2009: 16f.), zum Beispiel, behauptet, dass relevante Gebrauchskontexte nicht 
von Bedeutungen losgelöst werden können und umgekehrt. Ähnlich ist Lang- 
acker (2001) der Meinung, dass sprachliche Einheiten nicht völlig von den ‚usage 
events‘ getrennt werden können, in denen sie vorkommen. Auch wenn den Ge- 
brauchsbedingungen und typischen Gebrauchskontexten in der bisherigen kon- 
struktionsgrammatischen Forschung nicht immer gleich viel Aufmerksamkeit ge- 
widmet worden ist (Deppermann 2011: 219, Zima 2011: 108)’, so gibt es durchaus 
Konstruktionsgrammatiker, die darauf hinweisen, dass diese Aspekte auch für 
konstruktionsgrammatische Analysen relevant sind bzw. sein können (u. a. Gold- 
berg 2003: 221, Fried/Östman 2004: 21 und Ziem/Lasch 2013: 87-89, vgl. auch La- 
koff 1987: 467, der die Gebrauchsbedingungen im Grunde genommen zur Bedeu- 
tungsebene zählt’). Da es sich bei Abtönung um ein deutlich kontextsensitives 
Phänomen handelt (mehr Abtönung in sogenanntem ‚small talk‘, kontextabhän- 
gige Bedeutungen usw., vgl. Kapitel 2), wird in vorliegender Arbeit der Kontext 
dauernd in Betracht gezogen und auch als wichtiger Teil der Konstruktion be- 
trachtet. Auch wenn im Kapitel zur Konstruktionsfrage (Kapitel 14) der Gebrauch 
nicht den eigentlichen Fokus darstellt, so wird er doch ein roter Faden durch die 
Arbeit sein. 


3 Weiter zu erwähnen ist allerdings Deppermann (2006a,b). 

4 Auffällig ist in dieser Hinsicht auch das Fehlen der Kontext- bzw. Gebrauchsebene in Abbil- 
dung 4. 

5 Zu erwähnen ist auch Langacker (2001), der in seinem CDS-Modell (‚current discourse space‘) 
den Kontext durchaus modelliert. Allerdings sind auch bei ihm die symbolische Einheit und ihre 
kontextuelle Einbettung durchaus verschiedene (wenngleich eng vernetzte) Größen. 
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Die bisherige Besprechung zusammenfassend ließe sich festhalten, dass es 
sich bei einer Konstruktion um eine Form-Bedeutungspaarung handelt, die be- 
stimmten Gebrauchsbedingungen unterliegt und bei deren Analyse integrativ 
alle relevanten Ebenen in Betracht zu ziehen sind. Zwei Aspekte sind jedoch bis- 
lang nicht besprochen worden: der Abstraktheitsgrad und der Umfang einer Kon- 
struktion. Diese beiden Aspekte sind nicht in der Definition des Konstruktionsbe- 
sriffs festgelegt. Was den Umfang betrifft, kann jede Einheit, die als eine 
symbolische Koppelung von Form und Bedeutung zu analysieren ist, als eine 
Konstruktion betrachtet werden, von Morphemen über Wörtern und Wortgrup- 
pen bis hin zu Strukturen, die dem traditionellen Satzbegriff entsprechen (u. a. 
Goldberg 2006: 5), und sogar darüber hinaus (vgl. Ziem/Lasch 2013: 14; man 
denke zum Beispiel auch an Östmans [2005] Begriff des ‚construction dis- 
course“). Obwohl sich die Konstruktionsgrammatik bislang vor allem mit kom- 
plexeren Strukturen befasst hat, besteht also durchaus die Möglichkeit, Einzel- 
wörter wie Modalpartikeln als Ausgangspunkt für eine konstruktions- 
grammatische Analyse zu nehmen. 

Ähnlich ist nicht a priori festgelegt, wie abstrakt eine Konstruktion zu sein 
hat. Dies betrifft sowohl die Form als auch die Bedeutung. Auf die unterschiedli- 
che Abstraktheit auf Bedeutungsebene wurde im Grunde genommen oben bereits 
hingewiesen: Konstruktionen können eine sehr spezifische Bedeutung haben, 
aber genauso gut kann es sich um eine sehr abstrakte Bedeutung oder um eine 
Diskursfunktion handeln (vgl. Smirnova/Mortelmans 2010: 139). Ähnlich ist die 
Situation auf der Ebene der Form: Manche Konstruktionen haben eine lexikalisch 
völlig spezifizierte Form, während andere durchaus schematischer sind und ei- 
nige nichtfixierte Stellen oder ‚Slots‘ aufweisen, die durch unterschiedliche Ele- 
mente befüllt werden können. Vielfach scheint Abstraktheit auf der Formebene 
mit Abstraktheit auf der Bedeutungsebene einherzugehen.’ Die Ditransitivkon- 
struktion zum Beispiel hat eine ziemlich allgemeine und abstrakte Bedeutung, 
und von der Form her hat sie zwar eine feste Struktur, aber alle Stellen in der 
Konstruktion können durch unterschiedliche Elemente eingenommen werden 
(sofern sie von der Bedeutung her mit der jeweiligen Stelle verträglich sind). 

Wichtig ist in dieser Hinsicht die Feststellung, dass schematischere Mutter- 
konstruktionen neben spezifischeren Tochterkonstruktionen separat gespeichert 


6 Auf die Ähnlichkeit von Konstruktionen und kommunikativen Gattungen hat auch Günthner 
(2006) hingewiesen. 

7 Dies ist jedoch keine allgemeine Regel. Diskursmarker zum Beispiel haben im Allgemeinen 
eine ziemlich feste Form aber eine sehr abstrakte und variable (bzw. kontextabhängige) Bedeu- 
tung. 
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sein können. Dies ist im Einklang mit der obigen Erweiterung von Goldbergs Kon- 
struktionsbegriff: Wenn sie häufiger vorkommen, können Muster, die völlig aus 
einer abstrakteren Konstruktion ableitbar sind, doch auch separat gespeichert 
werden. So können taxonomische Netzwerke von Konstruktionen entstehen, in 
denen spezifischere Konstruktionen schematischeren Konstruktionen unterge- 
ordnet sind (u. a. Deppermann 2006a: 50, vgl. Abbildung 5). 


[NP VP] 
en 
[NP Kopula Adj] [NP V Obj1 Obj2] 
u 


[NP Kopula so EvalAdj] [NP Kopula NP] ... 


un, Ben. nn 
[das Kopula so hart) [das Kopula so blöd] [das Kopula so gut] .... 


Abb. 5: Taxonomisches Konstruktionsnetzwerk (nach Deppermann 2006a: 50) 


4.1.2 Grundannahmen der Konstruktionsgrammatik 


Neben dem oben dargelegten Konstruktionsbegriff, der im Grunde genommen 
das eigentliche definitorische Merkmal der Konstruktionsgrammatik darstellt, 
sind einige weitere Prämissen und Grundannahmen zu nennen, die von mehre- 
ren (wenn nicht gleich allen) Zweigen der Konstruktionsgrammatik geteilt wer- 
den. Im Folgenden sei kurz auf die wichtigsten eingegangen. 


1) Die Konstruktionsgrammatik ist ein „umfassender Beschreibungsrahmen sprach- 
lichen Wissens“ (Deppermann 2006a: 48). 

Wenn man sich den realen Sprachgebrauch, und insbesondere die spontan ge- 
sprochene Sprache, anschaut, so stellt man fest, dass viele realisierte Strukturen 
nicht von den traditionellen, an der Schriftsprache orientierten Regeln lizensiert 
werden (u. a. Deppermann 2006a: 44-46). Daher wurden diese Phänomene in 
der traditionellen linguistischen Forschung vielfach ins Abseits gestellt. Die Ab- 
sicht der Konstruktionsgrammatik ist es jedoch, die Sprache als Ganzes zu be- 
schreiben (u. a. Goldberg 2003: 219). Es werden mit anderen Worten keine Struk- 
turen von vornherein ausgegrenzt, und es wird auch nicht zwischen ‚richtigen‘ 
und ‚falschen‘ Strukturen unterschieden (Smirnova/Mortelmans 2010: 141) - 
höchstens könnte man sagen, eine Struktur sei nicht belegt, ungeläufig, oder 
nicht im Einklang mit der schriftsprachlichen Norm. 
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2) Bei der Beschreibung von Konstruktionen ist ‚bottom-up‘ vorzugehen. 

Im Einklang mit der Prämisse, dass nichts von vornherein ausgeschlossen wer- 
den darf, ist auch die Annahme, dass sich bei der Analyse eine Bottom-up-Vorge- 
hensweise aufdrängt. Es wird nicht a priori bestimmt, was zu analysieren ist bzw. 
was als eine Konstruktion betrachtet wird. Vielmehr gilt das „Primat des materiell 
performierten Konstrukts“ (Bücker 2012: 61): Es wird vom realen Sprachgebrauch 
ausgegangen, und die Analyse ist davon abhängig, was man vorfindet. Konstruk- 
tionen sind mit anderen Worten Abstrahierungen über die real vorgefundenen 
Daten bzw. über die einzelnen Konstrukte, d. h. die einzelnen Belege oder Instan- 
ziierungen, wie sie im Sprachgebrauch realisiert werden und in den Daten vorzu- 
finden sind. 


3) Die Konstruktionsgrammatik ist ein gebrauchsbasierter Denkrahmen. 

Im Grunde genommen ist die Bottom-up-Vorgehensweise nichts anderes als das 
methodologische Spiegelbild einer weiteren Grundannahme der Konstruktions- 
grammatik. Diese gilt nämlich als ein gebrauchsbasierter (‚usage-based‘) Ansatz 
(u. a. Deppermann 2006: 56-58).° In solchen gebrauchsbasierten Ansätzen wird 
davon ausgegangen, dass die Sprache bzw. das Sprachsystem (und insbesondere 
dessen kognitive Repräsentation) im Sprachgebrauch entsteht und durch die Er- 
fahrung mit Sprache geschaffen wird. Dies impliziert, dass die Konstruktionen 
nicht ein für alle Mal festliegen, sondern sich im Grunde genommen ständig den 
aktuellen Spracherfahrungen anpassen und sich auch im Laufe der Zeit entwi- 
ckeln können (wie sich auch Sprache im Allgemeinen dauernd ändert). 

Insbesondere ist dies für den Spracherwerb relevant: Ähnlich wie Konstruk- 
tionsgrammatiker über Einzelkonstrukte hinweg abstrahieren, um zu einer Kon- 
struktion zu kommen, ist auch der Spracherwerb ein Prozess der Abstraktion 
über diejenigen Einzelstrukturen, die die Lernenden als Input bekommen (u. a. 
Goldberg 2003: 219). Die Strukturen, die Sprachlerner produzieren, werden im- 
mer komplexer, und dementsprechend nehmen auch die Komplexität und der 
Abstraktheitsgrad der Konstruktionen, mit denen sie vorgehen, zu (u. a. Toma- 
sello 2006, Borensztajn et al. 2009, Diessel 2013). 

Mit der Gebrauchsbasiertheit hängt auch das oben angesprochene Bestehen 
taxonomischer Konstruktionsnetzwerke zusammen. Wie Bücker (2012: 80) an- 
gibt, zeichnet sich Konstruktionsgrammatik eher durch ‚computing parsimony‘ 
als durch ‚storage parsimony‘ aus. Dies hat damit zu tun, dass erstere für den 


8 Zur Theorie der Gebrauchsbasiertheit: vgl. u.a. Kemmer/Barlow (2000) und Langacker 
(2000), sowie die Arbeiten Bybees (insbesondere Bybee 2006, 2010, 2013). 
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Sprachgebrauch vorteilhafter ist: Je einfacher die Sprache zu verarbeiten ist (so- 
wohl in der Produktion als auch in der Rezeption), umso leichter ist ihre Verwen- 
dung. Wenn man häufig verwendete Instanziierungen von Konstruktionen direkt 
abrufen kann, so ist die mentale Verarbeitung weniger komplex, als wenn der 
Umweg über die schematischere Konstruktion gemacht werden muss. Aus die- 
sem Grund wird in der Konstruktionsgrammatik die oben angesprochene Ansicht 
vertreten, dass rekurrente Konstrukte bzw. Tochterkonstruktionen separat neben 
der abstrakteren Mutterkonstruktion, aus der sie abzuleiten sind, gespeichert 
sein können. 


4) Konstruktionen sind sprachspezifisch. 

Ein weiterer Punkt, der im Grunde genommen auf die Gebrauchsbasiertheit zu- 
rückzuführen ist, ist die Annahme, dass Konstruktionen immer sprachspezifisch 
sind (Goldberg 2003: 219, vgl. auch Croft 2001). Diese These wird vielfach nicht 
als separate Grundannahme der Konstruktionsgrammatik aufgelistet, folgt aber 
direkt aus der Beobachtung, dass sich Konstruktionen aus dem Sprachgebrauch 
entwickeln. Tatsächlich sind Konstruktionen nur kennzeichnend für den Sprach- 
gebrauch, der ihnen zugrunde liegt. Der Sprachgebrauch, mit denen Sprecher 
und Lernende konfrontiert werden, ist an bestimmten Sprachen gebunden, und 
dementsprechend sind auch die Konstruktionen, die daraus hervorgehen, ty- 
pisch für diese Sprachen. Das soll nicht heißen, dass sich keine Ähnlichkeiten 
zwischen Konstruktionen in unterschiedlichen Sprachen nachweisen lassen; nur 
darf nicht davon ausgegangen werden, dass unterschiedliche Sprachen die glei- 
chen Konstruktionen teilen oder dass entsprechende Konstruktionen in unter- 
schiedlichen Sprachen identisch sind (vgl. Verhagen 2003). 


5) Die Konstruktionsgrammatik ist eine nicht-modulare Sprachtheorie. 

In traditionellen Theorien zur Architektur sprachlichen Wissens wird im Allge- 
meinen von einem modularen Aufbau ausgegangen. Auf u. a. Jackendoff (1997) 
basierend hat Deppermann (2006a: 52) dies folgendermaßen dargestellt: 


5 Phonologisches Modul 
PP} : - RE Verknüpfungsregeln 
m Syntaktisches Modul 


= 
. 
: 
s Verknüpfungsregeln 


Semantisches/konzeptuelles Modul 


Abb. 6: Modulare Repräsentationsarchitektur (nach Deppermann 2006a: 52) 
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Wie in dieser Graphik illustriert wird, wird traditionell von unterschiedlichen 
grammatischen Modulen ausgegangen, die klar vom Lexikon getrennt sind, al- 
lerdings untereinander sowie mit dem Lexikon interagieren. Diese Trennung 
wird in der Konstruktionsgrammatik aufgehoben. Damit ist nicht gemeint, dass 
bei der Analyse einer Konstruktion nicht zwischen ihren phonologischen und 
syntaktischen Eigenschaften unterschieden werden könnte; nur wird davon aus- 
gegangen, dass es sich nicht um unterschiedliche Module handelt, sondern viel- 
mehr um Facetten, die gemeinsam die Konstruktion bestimmen. Am wichtigsten 
ist aber die Aufhebung der Trennung zwischen Lexikon und Grammatik. Viel- 
mehr wird von einem Kontinuum zwischen den beiden ausgegangen, das sich 
auch darin zeigt, dass Einzelwörter und komplexe syntaktische Strukturen 
gleichermaßen als Konstruktionen zu sehen sind (vgl. oben), und dass vor allen 
Dingen komplexe lexikalische Einheiten wie Idiome keine Sonderstellung im Sys- 
tem einnehmen, sondern ebenfalls als reine Konstruktionen zu betrachten sind. 


6) Die Konstruktionsgrammatik ist nicht derivationell. 

Ein weiterer Unterschied zu den traditionellen, insbesondere zu den transforma- 
tionell ausgerichteten generativen Grammatiktheorien ist, dass die Konstrukti- 
onsgrammatik als „deklarativ“ (Auer 2006: 291) gilt. Sie ist mit anderen Worten 
nicht derivationell (u. a. Smirnova/Mortelmans 2010: 134), das heißt, dass in der 
Konstruktionsgrammatik nicht davon ausgegangen wird, dass eine Konstruktion 
durch Derivation oder Transformation aus einer anderen abzuleiten ist. Dies liegt 
auch daran, dass die Konstruktionsgrammatik oberflächenstrukturell ausgerich- 
tet ist: Die Sprache wird so analysiert, wie sie sich darbietet, ohne von einer un- 
terliegenden Tiefenstruktur auszugehen, wie das in den transformationell-gene- 
rativen Denkrahmen üblich ist (vgl. auch Deppermann 2007: 117). 

Erneut soll dies nicht heißen, dass in der Konstruktionsgrammatik nicht von 
Beziehungen zwischen Konstruktionen ausgegangen werden kann, die auf eine 
annähernde Bedeutungsäquivalenz deuten können (vgl. auch Fischer 2007: 143). 
Tatsächlich ist das Konstruktikon, d. h. das Inventar bzw. das Netzwerk von Kon- 
struktionen in einer Sprache, mehr als nur eine komplexe Taxonomie, von der 
das Baumdiagramm in Abbildung 5 Teil wäre: Auch weitere Beziehungen zwi- 
schen Konstruktionen können angenommen werden, nur können diese nicht de- 
rivationeller Natur sein (vgl. dazu auch Fischer 2007: 143). 


7) Konstruktionen sind Prototypenstrukturen. 

Die siebte und letzte hier anzusprechende Grundannahme, die sich ebenfalls auf 
die Struktur des Konstruktikons bezieht, dürfte die kontroverseste sein. Gemeint 
ist die These, dass Konstruktionen als Prototypenstrukturen zu betrachten sind. 
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Obwohl diese Idee im Grunde genommen schon von Lakoff (1987) eingeführt 
wurde, scheint sie bislang nur beschränkt Eingang gefunden zu haben. In jünge- 
ren Zeiten wird allerdings zunehmend für eine solche Herangehensweise plädiert 
(u. a. Gries 2003, Imo 2007a, Ziem/Lasch 2011: 279). Streng genommen zwingt 
sich eine Prototypenanalyse auch auf, wenn man die Prinzipien der Konstrukti- 
onsgrammatik konsequent durchführt, da auch Wortarten prinzipiell als Kon- 
struktionen zu betrachten sind (s. Abschnitt 4.2) und es sich bei Wortarten um 
Prototypenstrukturen handelt (s. Abschnitt 2.2.3). Allerdings reicht die Prototypi- 
zität weiter als nur die Konstruktionen, die mit den traditionellen Wortarten über- 
einstimmen: Auch für andere Konstruktionen gilt, dass sie prototypischere und 
weniger prototypische Instanziierungen bzw. Konstrukte vertreten können.’ 

Ebenfalls wichtig ist, dass Prototypenstrukturen Strukturen mit unscharfen 
Grenzen sind. Dementsprechend sind auch die Grenzen zwischen Konstruktio- 
nen nicht immer klar zu ziehen, und es dürfte Konstrukte geben, die nicht klar 
einer einzigen Konstruktion zuzuweisen sind, sondern die vielmehr zwischen 
mehreren Konstruktionen anzusiedeln sind, wie auch Imo (2011b) in seiner An- 
wendung der Granularitätstheorie auf die Konstruktionsgrammatik gezeigt hat. 
Auch diese Beobachtung ist insbesondere für Wortartenkonstruktionen relevant, 
dürfte aber auch für andere Konstruktionen gelten. Dies hat auch seine Auswir- 
kungen auf den Konstruktikonbegriff: Das Konstruktikon ist nicht mehr als tra- 
ditionelle Netzwerkstruktur zu sehen, denn obwohl es netzwerkähnliche Verbin- 
dungen zwischen den Konstruktionen gibt, wird in traditionellen Netzwerken 
vielfach doch eher von klar abgegrenzten Kategorien ausgegangen, während das 
also für Konstruktionen nicht gilt. 


4.2 Modalpartikeln als Konstruktionen 


Wenn man Modalpartikeln als (multimodale) Konstruktionen beschreiben 
möchte, so muss man sich zunächst darüber im Klaren sein, ob bzw. wie sich Mo- 
dalpartikeln überhaupt konstruktionsgrammatisch beschreiben lassen. Darauf 
einzugehen ist das Ziel dieses Abschnitts. Zugleich soll auch gezeigt werden, wie 


9 Als Beispiel kann die von Verhagen (2003) besprochene ‚Weg‘-Konstruktion gelten: Typi- 
scherweise hat diese die Struktur sich einen/den Weg bahnen, aber man findet auch unprototy- 
pische Belege mit anderen Verben, etwa ebnen. Damit ist auch zu verknüpfen, dass Konstrukti- 
onen sowieso vielfach eine gewisse Variabilität aufweisen können, und dass die Formseite einer 
Konstruktion durchaus optionale Elemente enthalten kann (vgl. Imo 2007 sowie die Diskussion 
zum multimodalen Konstruktionsbegriff in Kapitel 14). 
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die Konstruktionsgrammatik mit der im zweiten Kapitel angesprochenen Wortar- 
tenproblematik umgeht. 

Obwohl Modalpartikeln bislang nicht gerade im Zentrum der konstruktions- 
grammatischen Forschung gestanden haben, steht einer Analyse im Rahmen der 
Konstruktionsgrammatik im Grunde genommen nichts im Wege. Tatsächlich hat 
die Konstruktionsgrammatik bislang vor allem komplexere Strukturen fokus- 
siert, aber wie oben bereits dargelegt wurde, sind auch Einzelwörter durchaus als 
Konstruktionen zu betrachten (vgl. auch Dąbrowska 2009). Auch die Tatsache, 
dass Modalpartikeln keine propositionale Bedeutung aufweisen, wurde oben als 
für die Konstruktionsgrammatik unproblematisch dargestellt. 

Dass es möglich ist, Modalpartikeln als Konstruktionen zu analysieren, hat 
Imo (2006, 2007b, 2008) bereits gezeigt, und auch Meer (2012) hat zwischen der 
Modalpartikelforschung und der Konstruktionsgrammatik eine Brücke geschla- 
gen.” Der Unterschied zwischen den beiden Herangehensweisen besteht darin, 
dass Imo die lexikalischen Partikeln an sich beschreibt, in den Konstruktionen 
[Modalpartikel halt] und [Modalpartikel], während Meer eher von komplexen, 
satzähnlichen partikelhaltigen Strukturen wie [liSkl + ja + prädErg] ausgeht und 
diese als Ganzes beschreibt." 

Als Ansatz seien zunächst Imos (2007b: 54) Beschreibung der Konstruktion 
[Modalpartikel]"? sowie seine (2008: 139) Beschreibung der Konstruktion [Modal- 
partikel halt] dargeboten: 


10 Zu erwähnen sind auch Larsen/Fischer (2012), die allerdings nicht die konstruktionsgram- 
matische Analyse der Partikeln an sich thematisieren, sondern vielmehr die Modalpartikeln her- 
anziehen, um für eine Erweiterung des Konstruktionsbegriffs um den Argumentationshinter- 
grund (der in vorliegender Arbeit zum Kontext gezählt wird) zu plädieren. Fischer/Alm (2013) 
liefern, nach dem gleichen Muster wie Imo (a. a. O.), eine konstruktionsgrammatische Analyse 
des schwedischen alltså sowie des deutschen also, dessen Einstufung als Modalpartikel jedoch 
kontrovers ist. 

11 Die eckigen Klammern deuten eine Konstruktion an; liSkl = linke Satzklammer; prädErg = 
prädikative Ergänzung. Gemeint sind mit [liSkl + ja + prädErg] Strukturen wie Das ist ja völliger 
Blödsinn (Meer 2012: 96), bei denen allerdings Vorfeldelemente (in diesem Beispiel das) streng 
genommen nicht zur Konstruktion gezählt werden. 

12 Die folgende Darstellung unterscheidet sich in zweierlei Hinsicht von Imo (a. a. O.). Zum ei- 
nen ist bei ‚Prosodie‘ - im Anschluss an die Diskussion im Abschnitt 2.1.2 - von Heterosemen 
statt von Homonymen die Rede, und zum anderen wird die Prosodie hier vor der Semantik auf- 
gelistet, damit alle Formmerkmale zusammen stehen, vgl. noch die ältere Konstruktionsbe- 
schreibung in Imo (2006: 273). 

13 Wichtig ist, dass die tabellarische Darstellungsweise vor allem der Übersichtlichkeit und Ver- 
gleichbarkeit halber verwendet wird, und also nicht direkt eine Abspiegelung der Attribut-Wert- 
Matrizen ist, die in den formal-generativen Zweigen der Konstruktionsgrammatik üblich sind. 
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Schematische Konstruktion [Modalpartikel] (Prototyp) 
Syntax bis auf Ausnahmen nicht erststellenfähig; 
in den Satzverband integriert, aber keine selbstständigen 
Satzglieder: nicht erfragbar, nicht satzwertig; 


kombinierbar 
Morphologie unflektierbar 
Prosodie tendenziell unbetont/unbetonbar (abhängig von Heterose- 
men); 
prosodisch in das Syntagma integriert 
Semantik synsemantisch 
Funktion Modalisierung von Äußerungen: Kodieren der Einstellung 


des Sprechers zur Äußerung und deren Kontext 


Spezifische Konstruktion [Modalpartikel halt] 
Bezug zuanderen Mögliche Interferenzen anderer Partikel-Konstruktionen 
Konstruktionen (Diskursmarker, Fokuspartikeln, Skalarpartikeln etc.) 
Syntax im Mittelfeld; 
in den Satzverband integriert, aber keine selbstständi- 
gen Satzglieder: nicht erfragbar, nicht satzwertig; 


kombinierbar 
Morphologie unflektierbar 
Prosodie unbetonbar 
Semantik entleert 
Funktion Verweis auf Vorgegebenes, Markierung der Äußerung, 


die halt enthält, als nicht-initial; 

Verweis auf einen „pragmatischen Prätext“!* 

Modalisierung von Äußerungen: Kodieren der Einstel- 
lung des Sprechers zur Äußerung und deren Kontext; 

Markiert Plausibilität einer Äußerung 

Sequentialität „die partikelhaltige Äußerung [erscheint] als zweiter, 

d.h. reaktiver Gesprächszug in einer unterstellten dia- 
logischen Sequenz“ (Diewald 1999: 188) 


14 Gemeint ist hier Diewalds (u. a. 2006) Begriff des pragmatischen Prätextes, der in Kapitel 2 
kurz angesprochen wurde, in vorliegender Arbeit jedoch nicht weiter verwendet wird. Darauf 
bezieht sich auch die nicht-initiale Natur der Äußerung, die in der vorangehenden Zeile ange- 
sprochen wurde. 
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Was gleich auffällt, ist, dass letztere Beschreibung detaillierter ist. Dies sollte 
nicht allzu sehr wundern, da es sich um eine spezifischere Konstruktion handelt 
(Imo selber bezeichnet [Modalpartikel halt] als „spezifische Konstruktion“, [Mo- 
dalpartikel] dagegen als „schematische Konstruktion“). [Modalpartikel] abstra- 
hiert über alle einzelnen Modalpartikelkonstruktionen und ist dementsprechend 
fast per Definition schematischer. 

Trotz der etwas anderen Herangehensweise unterscheiden sich Meers Kon- 
struktionsbeschreibungen im Wesentlichen nicht sehr stark von Imos Beschrei- 
bungen. Zum Vergleich sei hier Meers (2012: 100) Beschreibung der Konstruktion 
[liSkl + ja + prädErg] angeführt, die einzige, die sie in dieser Detailliertheit ausar- 
beitet: 


Komplexe und teilspezifische Konstruktion [liSkl + ja + prädErg] 
Morphologie insgesamt bis auf den Gebrauch der nicht flektierenden 
Abtönungspartikeln [sic] nicht spezifisch definiert 
Prosodie bis auf das unbetonte und prosodisch integrierte ja 
nicht spezifisch determiniert 
Syntax Aussagesatz, in dessen Mittelfeld die Abtönungspartikel 
ja eine Nominativ- oder eine Akkusativergänzung pro- 
jiziert; 
ja befindet sich in prototypischer Hauptsatzstellung an 
der Nahtstelle zwischen dem finiten Prädikatsteil und 
der prädikativen Ergänzung 
Semantik (schwach kontrastive) Bezugnahme auf die Vorgänge- 
räußerung 
Funktion referiert auf eine potenzielle Fraglichkeit und legt Hö- 
rer(inne)n nahe, die geäußerte Proposition zu über- 
nehmen; 
Teil eines diskursiven Aushandlungsprozesses 
Pragmatik assertierte Proposition im Zusammenhang mit einer 
Fraglichkeit 


Wenn man diese Konstruktionsbeschreibung mit Imos oben dargebotenen 
Beschreibungen vergleicht, so merkt man, dass die Unterschiede hauptsächlich 
darauf zurückzuführen sind, dass Meer eben nicht nur eine Modalpartikel als 
Konstruktion hat, sondern eine partikelhaltige Struktur. Sieht man vom Bedeu- 
tungsunterschied zwischen halt und ja einmal ab, so unterscheidet sich Meers 
Konstruktion [liSkl + ja + prädErg] von Imos Konstruktion [Modalpartikel halt] im 
Hinblick auf die Partikel nur darin, dass Imo zusätzlich den Bezug zu anderen 
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Konstruktionen und die Sequentialität anspricht und einige weitere syntaktische 
Merkmale erwähnt. Im Großen und Ganzen sind die Beschreibungen aber mitei- 
nander kompatibel. 

Welche der beiden Herangehensweisen die angemessenere ist, ist an dieser 
Stelle schwer festzulegen, da sie von unterschiedlichen Perspektiven zeugen. 
Wichtig ist an dieser Stelle vor allem, zu zeigen, dass unabhängig von der Per- 
spektive (Partikel oder partikelhaltige Struktur) eine Konstruktionsbeschreibung 
aufgestellt werden kann, die mit der theoretischen Diskussion des zweiten Kapi- 
tels im Einklang ist. 


4.3 Multimodalität in der Konstruktionsgrammatik 


Bislang wurde auf die drei Kernbegriffe des Themas der vorliegenden Arbeit (Mo- 
dalpartikeln als multimodale Konstruktionen) eingegangen, und es wurde gezeigt, 
dass sich Modalpartikeln durchaus als Konstruktionen analysieren lassen. Wenn 
man sie allerdings als multimodale Konstruktionen analysieren möchte, so ist 
noch zu klären, wie das Verhältnis von Multimodalität und Konstruktionsgram- 
matik zu sehen ist. Obwohl die Frage nach dem multimodalen Konstruktionsbe- 
griff erst in Kapitel 14, d. h. nach der eigentlichen Analyse der Daten, eingehender 
besprochen und mit einem Antwortversuch versehen werden kann, erscheint es 
wertvoll, an dieser Stelle zur Einrahmung der folgenden Analyse diese Diskus- 
sion schon mal kurz anzusprechen, da die multimodale Konstruktionsgrammatik 
noch in den Kinderschuhen steckt. Es soll auf zwei Aspekte der Diskussion ein- 
gegangen werden: Zum einen soll angedeutet werden, warum Multimodalität 
überhaupt in die Konstruktionsgrammatik zu integrieren wäre (4.3.1), und zum 
anderen soll eine kurze Übersicht bisheriger multimodal ausgerichteter kon- 
struktionsgrammatischer Analysen geliefert werden (4.3.2). 


4.3.1 Warum eine multimodale Konstruktionsgrammatik? 


Die Frage, ob das Konzept der Multimodalität in die Konstruktionsgrammatik in- 
tegriert werden sollte, scheint aus zweierlei Hinsicht relevant zu sein: zum einen 
aufgrund der Profilierung der Konstruktionsgrammatik als eine „Grammatik für 
die Interaktion“ (Deppermann 2006a: 43), zum anderen aufgrund des oben an- 
gesprochenen integrativen Konstruktionsbegriffs. In den beiden Domänen ist ein 
Argument für eine multimodale Konstruktionsgrammatik zu sehen. Darauf sei 
jetzt eingegangen. 
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Wie oben bereits dargelegt wurde, sieht sich die Konstruktionsgrammatik als 
umfassender Beschreibungsrahmen der Sprache. Damit ist gemeint, dass sie 
nicht von vornherein bestimmte Randphänomene ausgrenzt, sondern ebenso 
Strukturen fokussiert, die nicht der schriftsprachlichen Norm entsprechen, die 
jedoch in gesprochener Sprache häufiger vorkommen und dementsprechend für 
die Alltagsinteraktion wenigstens ebenso typisch (wenn nicht typischer) sind 
(vgl. u. a. Deppermann 2006a). In diesem Zusammenhang wurde schon explizit 
für die These argumentiert, dass die Konstruktionsgrammatik einen geeigneten 
Beschreibungsrahmen für die Interaktionsforschung darstellt (u. a. Auer 2006, 
Deppermann 2006a, 2011, Günthner/Imo 2006). 

Oben wurde ebenfalls bereits darauf hingewiesen, dass Interaktion inhärent 
multimodal ist und dass für eine „adäquate“ (Schmitt 2005: 23) Analyse der In- 
teraktion dementsprechend auch die nonverbalen Ausdrucksebenen zu berück- 
sichtigen sind. Zudem wurde im Abschnitt 3.3.2 argumentiert, dass multimodale 
Größen wie die Gestik als inhärenter Teil der Sprache zu betrachten sind. Wenn 
also die Konstruktionsgrammatik ihre selbsterklärten Ziele erreichen möchte, 
eine „Grammatik für die Interaktion“ (Deppermann 2006a: 43) und einen „um- 
fassende[n] Beschreibungsrahmen sprachlichen Wissens“ (Deppermann 2006a: 
48) darzubieten, so kommt sie nicht um eine Einbeziehung des Multimodalen 
herum. 

Der zweite Punkt (integrativer Konstruktionsbegriff) bezieht sich auf die 
Formseite von Konstruktionen. Im Abschnitt 4.1.1 wurde bereits angedeutet, dass 
sich die Geister an der Frage darüber sscheiden, wie breit diese Formseite aufzu- 
fassen ist, und im Anschluss an etwa Imo (2011: 117) wurde von einem breiten 
Formbegriff ausgegangen, der alle relevanten Ebenen umfasst. Zwar hat Imo ver- 
mutlich vor allem an die unterschiedlichen verbalen Ebenen gedacht, aber es 
scheint durchaus berechtigt, sich die Frage zu stellen, ob multimodale Größen 
wie die Gestik nicht auch als relevant zu betrachten sind und dementsprechend 
in die Formseite der Konstruktion zu integrieren wären. Tatsächlich wurde oben 
bereits auf das enge Zusammenwirken von Verbalem und Gestischem hingewie- 
sen, und die enge Vernetzung der beiden Ausdrucksebenen soll auch aus der fol- 
genden Analyse nochmals deutlich werden. Es ließe sich also die These verteidi- 
gen, dass die Gestik auch einen relevanten Aspekt der Formseite darstellt und 
dementsprechend in den Konstruktionsbegriff einzubeziehen wäre. 

Im Anschluss daran sei abermals auf Langacker (2001: 146) hingewiesen, der 
die Ansicht seiner ‚Cognitive Grammar‘ zum Konstruktionsbegriff folgenderma- 
ßen zusammenfasst: 
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Cognitive Grammar takes the straightforward position that any aspect of a usage event, or 
even a sequence of usage events in a discourse, is capable of emerging as a linguistic unit, 
should it be a recurrent commonality. [Hervorhebung im Original] 


Da auch Gestik ein rekurrenter Aspekt des ‚usage event‘ sein kann, ist mit Lang- 
acker festzuhalten, dass Gestik auch als sprachliche Einheit (bzw. als Facette ei- 
ner sprachlichen Einheit), d. h. als Konstruktion, zu betrachten ist - vorausge- 
setzt, dass es sich tatsächlich um ein rekurrentes Muster handelt. In der Hinsicht 
soll es wohl auch nicht wundern, dass gerade Langacker derjenige ist, zu dem 
oben gesagt wurde, dass er Gestik explizit als möglichen Formaspekt einer Kon- 
struktion erwähnt. Die potenzielle Rekurrenz und dementsprechend Relevanz 
der Gestik ist also als weiteres Argument dafür anzuführen, Gestik (und ggf. auch 
andere multimodale Ausdrucksebenen) in die Konstruktionsgrammatik zu integ- 
rieren. 


4.3.2 Forschungsstand 


Trotz dieser Argumente für eine Erweiterung der Konstruktionsgrammatik auf 
Multimodales steckt die konstruktionsgrammatisch orientierte Multimodalitäts- 
forschung bislang noch in den Kinderschuhen. Der Schritt, dass Gesten an sich 
wenigstens konstruktionsaffin sein können, dürfte für viele Konstruktionsgram- 
matiker noch eher unproblematisch sein (obwohl diese Position in der Literatur 
m. W. kaum vertreten wird). Tatsächlich lassen sich Gesten als symbolische Paa- 
rung einer Form mit einer Bedeutung betrachten. Dementsprechend sind die ein- 
zelnen Gesten wenigstens als Konstrukte einzustufen, und wenigstens bei den 
rekurrenteren und zum Teil konventionalisierten Gesten scheint eine Analyse als 
Konstruktion, d. h. als Abstrahierung über verwandte Konstrukte, plausibel. 

Allerdings hätte man es in dem Fall immer noch nicht mit einer multimoda- 
len Konstruktion im wahrsten Sinne des Zortes zu tun: Die Formseite der Kon- 
struktion enthält auch in diesem Fall nur einen einzigen Kommunikationsmodus 
- allerdings nicht den verbalen, sondern den gestischen. In der Hinsicht ist eine 
solche gestische Konstruktion eigentlich immer noch monomodal, und für die 
Analyse von multimodalen Belege wäre also auf zwei kookkurrente monomodale 
Konstruktionen (die verbale und die gestische) zurückzugreifen. Aufgrund der 
systematischen Kookkurrenzen von Gestik und Verbalem, die in bisherigen Ges- 
tikanalysen beschrieben worden sind (und auch in der folgenden Analyse nach- 
gewiesen werden sollen), erscheint jedoch die Idee als wertvoll, die beiden Aus- 
drucksebenen in eine Konstruktion zu integrieren, die dann als multimodal im 
vollen Sinne einzustufen wäre. 
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Diese Idee wurde in der Literatur bereits vertreten und scheint auch an 
Beliebtheit zu gewinnen. Trotzdem sind die Ansätze in dieser Richtung noch eher 
selten und noch nicht immer voll ausgereift. Forscher wie Streeck (2009: 96) und 
Mondada (2012: 202) verweisen zwar auf das Konzept einer multimodalen Kon- 
struktion, bei der unterschiedliche Ausdrucksebenen für die Vermittlung der Be- 
deutung eng zusammenwirken, rahmen dieses Konzept jedoch nicht explizit 
konstruktionsgrammatisch ein. In multimodal ausgerichteten konstruktions- 
grammatischen Arbeiten dagegen (u. a. Andrén 2010, 2014, Juszczyk 2012, 
Steen/Turner 2013, Wu 2013) wird durchaus, auf einer rein theoretischen Ebene 
oder anhand konkreter Fallstudien, für eine multimodale Erweiterung des Kon- 
struktionsbegriffs plädiert bzw. wird zumindest zu weiterer Erforschung ange- 
regt, die den Wert bzw. das Potenzial einer solchen Erweiterung herausfinden 
soll, aber auch in diesen Arbeiten wird im Allgemeinen kaum oder nicht auf die 
Fragen eingegangen, welche Folgen eine solche multimodale Erweiterung für 
den Konstruktionsbegriff hat, welche Stelle den nonverbalen Größen in der Kon- 
struktion zuzuschreiben ist, und mit welchen Schwierigkeiten oder Problemen 
bei dieser multimodalen Erweiterung zu rechnen ist.” Bei diesen Schwierigkeiten 
handelt es sich um Fragen zur Häufigkeit der Kookkurrenz einer Geste mit einem 
verbalen Element bzw. zur Stärke der Korrelation (wann ist ein Muster ausrei- 
chend rekurrent bzw. verwurzelt, um von einer Konstruktion sprechen zu kön- 
nen?), Timing (was ist, wenn die Geste und der verbale Ausdruck nicht schön 
zeitgleich realisiert werden?) usw. 

Es ist nicht auszuschließen, dass diesen Problematiken bislang weniger Auf- 
merksamkeit gewidmet worden ist, weil sie sich nicht in allen Fällen gleich deut- 
lich manifestieren dürften. Für die im Folgenden zu analysierenden Abtönungs- 
formen sind sie aber von besonderer Relevanz, wie sich im Laufe der Arbeit noch 
zeigen wird. Dementsprechend stellt diese Analyse für eine weitere Überdenkung 
dieser Problematiken eine geeignete Grundlage dar. Daher sollen sie im Laufe der 
Arbeit wieder aufgegriffen und anhand der vorzustellenden Fallstudien verdeut- 
licht werden, insbesondere in Kapitel 14, in dem die Frage gestellt wird, ob es sich 
bei den im Folgenden zu beschreibenden Kookkurrenzmustern um multimodale 
Konstruktionen handelt. In der Hinsicht ist das Ziel der Arbeit nicht das Liefern 
einer detaillierten Beschreibung jeder einzelnen potenziellen multimodalen Kon- 
struktion, die sich aus der Datenanalyse ergibt, sondern vielmehr die Reflexion 
über die Schwierigkeiten, auf die man beim Erstellen einer solchen Beschreibung 
sowie bei der Entscheidung über den Konstruktionsstatus einzelner Muster stößt. 


15 Ausnahmen in dieser Hinsicht sind Elisabeth Zimas Arbeiten (u. a. 2013, 2014, 2017) sowie 
u.a. Cienki (2017) und Lanwer (2017a). 


5 Angaben zur Korpusstudie 


5.0 Einführung 


Bei der Beantwortung der Frage, inwiefern Modalpartikeln mit Gesten korrelieren 
und ob es sich bei diesen Kookkurrenzmustern um multimodale Konstruktionen 
handelt, wird von einer Korpusstudie ausgegangen, deren Ergebnisse in den Ka- 
piteln 7-14 vorgestellt und diskutiert werden. Zunächst seien jedoch in diesem 
und dem nächsten Kapitel einige methodische Angaben zu dieser Studie gelie- 
fert. In diesem kurzen fünften Kapitel werden einige allgemeine Anmerkungen 
zur Korpusstudie gemacht, und im nächsten Kapitel werden die Besonderheiten 
der Gestikanalyse eingehender besprochen. 


5.1 Verwendete Korpora 


Für die Analyse von Gestik reicht selbstverständlich ein traditionelles Text- oder 
Tonkorpus nicht aus: Man braucht auch Videomaterialien, in denen die Sprecher 
(und insbesondere ihre Gesten) zu sehen sind, während sie sprechen. Für die vor- 
liegende Arbeit wurde hauptsächlich mit zwei Arten von Daten gearbeitet: Fern- 
sehmaterialien und Parlamentsreden.' 

Die Fernsehmaterialien (Gesamtdauer ca. 17 Stunden) sind zweierlei Art. 
Zum einen wurden Talkshows und Fernsehdebatten verwendet, zum anderen 
live übertragene Berichterstattung von Sportveranstaltungen. In Bezug auf letz- 
tere Kategorie sei darauf hingewiesen, dass nicht die eigentlichen Berichte ver- 
wendet wurden, bei denen die Reporter meist nicht zu sehen sind, sondern viel- 
mehr die Vor- und Nachberichte, bei denen sich Moderatoren mit Athleten und 
sogenannten Experten (meist ehemalige Athleten) über das Event unterhalten, 
sowie Interviews mit den Teilnehmern und weiteren Einbezogenen (Trainern, 
Veranstaltern usw.). 

Bei den Parlamentsreden handelt es sich um eine Reihe von 21 Plenarreden 
im österreichischen Parlament aus den Jahren 2006-2007 (Gesamtdauer knapp 4 
Stunden). Elfvon diesen 21 Reden wurden live im Fernsehen übertragen, was sich 
auch auf die Gestaltung der Reden auswirkt (vgl. Zima 2011). Inwiefern dies auch 


1 Eine detailliertere Übersicht der Aufnahmen ist dem Anhang zu entnehmen. 
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einen Unterschied für die verwendete Gestik ausmacht, soll in Kapitel 12 ange- 
sprochen werden. 

Dieser Aufbau der Datensammlung bietet den Vorteil, dass unterschiedliche 
Situationen im Korpus enthalten sind: Talkshows, Sportberichte und Parla- 
mentsreden. Wie sich in Kapitel 12 zeigen wird, lassen sich damit Beobachtungen 
zur Distribution der Gesten verknüpfen. Es handelt sich zwar nicht um Aufnah- 
men richtiger spontaner Alltagskommunikation, aber wenigstens die Talkshow- 
gespräche sind doch als semi-spontan zu betrachten. Außerdem wird im Laufe 
der Arbeit noch die Beobachtung angesprochen, dass die für Parlamentsreden 
typische Aufregung auch die Distribution der im Rahmen der vorliegenden Ana- 
lyse relevanten Gestik beeinflussen dürfte, sodass dieser Datentyp sowieso eine 
interessante Grundlage für die Analyse der Rolle von Gestik beim Phänomen der 
Abtönung darstellt. 

Allerdings sind mit diesen Daten auch zwei Nachteile verbunden. Einerseits 
ist der Kamerastandpunkt für eine Gestikanalyse nicht immer ideal, da manch- 
mal die Sprecher nicht, nicht ganz (zum Beispiel nur das Gesicht) oder aus einer 
suboptimalen Ecke zu sehen sind. Dadurch ist eine genaue Beschreibung ihrer 
Gesten nicht immer möglich (selbstverständlich wurden nur die Partikelbelege, 
bei denen der Sprecher zu sehen ist, in die Analyse aufgenommen). Dennoch er- 
lauben die Daten durchaus interessante Beobachtungen im Rahmen dieser ersten 
systematischen Korrelationsanalyse von Gesten und Modalpartikeln im Deut- 
schen, wie aus den Ergebnissen in den Kapiteln 7-14 deutlich werden soll. 

Der zweite Nachteil hat mit der regionalen Distribution der Daten zu tun. Wie 
oben bereits angedeutet wurde, wurde für Embleme nachgewiesen, dass sie regi- 
ons- bzw. kulturspezifisch sind. Es ist nicht auszuschließen, dass sich solche re- 
sionalen Tendenzen oder Unterschiede auch bei den abtönungsliierten Gesten 
nachweisen lassen. Infolgedessen besteht das Risiko, dass sich die Ergebnisse 
der Analyse der Parlamentsdaten nicht über das gesamte deutsche Sprachgebiet 
verallgemeinern lassen, da es sich nur um österreichische Daten handelt. Für die 
Fernsehdaten ist das Risiko weniger hoch: Sie entstammen zwar vor allem Sen- 
dungen deutscher Fernsehprogramme, aber es kommen durchaus auch Österrei- 
cher zu Wort, sodass hier der Hang zu einer Region durchaus geringer ist. Da sich 
das Problem der regionalen Differenzierung also nur bei einem Teil der Daten 
stellt, und daes sich außerdem nur um eine erste systematische Studie des Feldes 
der gestischen Abtönung handelt, wurde die potenzielle Verzerrung der Daten 
infolge der suboptimalen regionalen Distribution in Kauf genommen. 
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5.2 Transkriptionskonventionen 


Ein zusätzlicher Schritt bei der Analyse gesprochener Daten im Vergleich zur 
Analyse geschriebener Daten ist die Transkription der Aufnahmen. Das ist bei 
Gestikanalysen nicht anders, da sich die Gestik vielfach auf das Gesprochene be- 
zieht. Besonders wenn Korrelationen von Gestik mit verbalen Elementen zu un- 
tersuchen sind — wie in der vorliegenden Arbeit -, ist eine adäquate Transkrip- 
tion des verbal Gesprochenen von nicht zu unterschätzender Wichtigkeit. 

Allerdings hat sich bislang noch kein Transkriptionssystem als Standard 
durchsetzen können. Insbesondere im Rahmen der Konversationsanalvyse ist die 
Zahl der kursierenden Systeme beachtlich, aber auch in anderen Forschungsdo- 
mänen hat sich noch kein System den Status von Standardkonvention verschaf- 
fen können.? 

Ein gängiges Transkriptionssystem (insbesondere in der heutigen germanis- 
tischen Forschung) ist ‚GAT 2‘ (Selting et al. 2009), eine überarbeitete Version des 
‚Gesprächsanalytischen Transkriptionssystems‘ (kurz: ‚GAT‘). Einer der wichtigs- 
ten Vorteile von GAT2 für Gestikanalysen ist, dass das Transkript in Intonations- 
einheiten aufgeteilt wird. Dies ist insofern relevant, als aus der bisherigen For- 
schung hervorgegangen ist, dass Gestikeinheiten häufig mit Intonations- 
einheiten übereinstimmen (u. a. Loehr 2004: 175). 

In GAT2 ist die Möglichkeit vorgesehen, „daß je nach Forschungsanliegen 
unterschiedlich differenziert transkribiert werden kann“ (Deppermann ‘2008: 
41). In ihrer Übersicht der GAT2-Konventionen definieren Selting et al. (2009) drei 
Hauptausbaustufen: Minimaltranskript, Basistranskript und Feintranskript. Im 
Hinblick auf die Relevanz der Faktoren und die Lesbarkeit, zwei der wichtigeren 
Eigenschaften eines guten Transkripts (vgl. u. a. Edwards 1993: 5-10 und Depper- 
mann ‘2008: 46-48), kann man durchaus die Annotation bestimmter Aspekte 
auslassen oder aber gerade bestimmte Faktoren, deren Andeutung im Grunde ge- 
nommen einer höheren Ausbaustufe angehört, hinzunehmen. In der vorliegen- 
den Arbeit wird mit einer Variante des Basistranskripts gearbeitet, die folgender- 
maßen aussieht: 


(69) 420 IN im SALZkammergut [da kann man gut lUstig 
sein; 
421 MK [ja; 
422 da ma dA kann man gut LUStig sein;= 
423 =beSONders mit (.) der tochter eines der 


größten äh komiker die es so gAb; 


2 Eine Übersicht einiger gängigerer Transkriptionssysteme liefert Bressem (2013a). 
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424 IN JA. 

425 hey äh hat man da überhaupt g gelEgenheit 
bei solchen shows mit den stars dann hinter 
der BÜHne mal,= 


426 > =s Ist ja {nicht mehr so wie FRÜher; } 
427 ihr HABT ja früher, 

428 HÖRT man immer wIEder; 

429 recht LANG gefElert; 


Aus diesem Beispiel wird die Aufteilung des Transkriptes in Intonationsein- 
heiten deutlich ersichtlich, dain GAT2 für jede neue Intonationseinheit auch eine 
neue Zeile angefangen wird. Die Nummern dieser Intonationseinheiten stehen 
jeweils links vor der Einheit, und zwischen diesen Nummern und den Einheiten 
selber erscheinen Sigel, die auf die Sprecher hinweisen. Da bei den meisten Bei- 
spielen als Interpretationshilfe auch die vorangehenden Intonationseinheiten 
wiedergegeben werden, wird zudem das Zeichen „>“ eingesetzt um auf die je- 
weils relevante Einheit hinzuweisen. 

Wichtig ist, dass bei GAT2 die Großschreibung nicht nach den gängigen Or- 
thografieregeln eingesetzt wird, sondern vielmehr dazu dient, das Betonungs- 
muster wiederzugeben: Die völlig groß geschriebene Silbe trägt den Hauptton, 
während Silben, von denen nur der Vokal groß geschrieben ist, nebenbetont 
sind. Auch die Interpunktionszeichen am Ende der Einheiten sind nicht als sol- 
che zu interpretieren, sondern sie indizieren den Tonhöhenverlauf am Ende der 
Einheit (fallend bei Punkt und Semikolon, flach bei Bindestrich, steigend bei 
Komma und Fragezeichen). Eine detaillierte Übersicht der weiteren Symbole, die 
bei GAT2 eingesetzt werden, liefern Selting et al. (2009); eine Kurzübersicht der 
in der vorliegenden Arbeit verwendeten Symbole ist dem Anhang zu entnehmen. 

GAT2 weist allerdings für Gestikanalysen auch einen beachtlichen Nachteil 
auf: Es ist vom Ursprung her rein verbal ausgerichtet. Im Gegensatz zu anderen 
Transkriptionssystemen wie HIAT° sind also in GAT2 keine Symbole für die An- 
deutung von Gestik vorgesehen. Wie Stukenbrock (2009) zeigt, lassen sich GAT- 
bzw. GAT2-Transkripte um Angaben zu multimodalen Phänomenen erweitern, 
indem zum Beispiel Standbilder, die diese verdeutlichen, hinzugefügt werden, 
oder indem in zusätzlichen Transkriptzeilen symbolische Angaben zu den Gesten 


3 HIAT steht für ‚Halbinterpretative Arbeitstranskription‘. Eine Übersicht der HIAT-Konventio- 
nen liefern Ehlich/Rehbein (1976) und Ehlich (1993); siehe zur Gestikannotation in HIAT auch 
u. a. Ehlich/Rehbein (1981a,b). Dass in vorliegender Arbeit nicht für HIAT optiert wird, liegt da- 
ran, dass HIAT in der heutigen Germanistik weniger gängig ist als GAT2 und zudem infolge der 
sogenannten Partiturschreibung m. E. weniger übersichtlich ist (und auch nicht nach Intona- 
tionseinheiten aufgeteilt). 
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der jeweiligen Intonationseinheit geliefert werden. Allerdings besteht bei einer 
solchen Vorgehensweise, wie Stukenbrock selber angibt, die Gefahr, dass die 
Lesbarkeit des Transkriptes darunter leidet. Daher wird im Folgenden für eine 
andere Vorgehensweise optiert: Die Worte, die zeitgleich mit der Geste gespro- 
chen werden, erscheinen in geschweiften Klammern, und die verbalen Elemente, 
die mit dem ‚stroke‘ und ggf. dem ‚stroke hold“ überlappen, werden unterstri- 
chen. Diese Vorgehensweise wird dadurch ermöglicht, dass keine Angaben zur 
Form der Gesten in die Transkripte aufgenommen werden müssen, denn tatsäch- 
lich sollen die Beispiele im Folgenden jeweils die Geste illustrieren, die gerade im 
Text besprochen wird. Um welche Geste es sich handelt, geht also aus der Be- 
schreibung hervor; wichtig ist in den Transkripten vor allem, dass markiert wird, 
wann diese Geste genau realisiert wird. Im oben angeführten Beispiel fängt also 
die Vorbereitungsphase der Geste bei nicht an, der Rückzug wird am Ende der 
Intonationseinheit vollzogen, und zeitgleich mit dem ‚stroke‘ werden die unter- 
strichenen Worte so wie gesprochen. 

Bei den Kopfgesten wird diese Unterstreichung allerdings nicht systematisch 
verwendet. Der Grund dafür ist, dass es bei Kopfgesten gelegentlich schwieriger 
ist, die klassischen Gestenphasen (Vorbereitung, Höhepunkt und Rückzug) zu 
unterscheiden. Auf die Korrelation von Kopf- und Handgesten in Negationskon- 
texten verweisend formuliert Harrison (2009: 204) es folgendermaßen: 


it invites us to ask whether head shakes are like manual gestures and have different phases 
of gestural action, such as preparation, stroke, and recovery phases. As far as I am aware, 
this question has not been investigated yet and most gesture researchers have viewed head 
shakes as different to manual gestures in this respect. 


Diese Annahme dürfte zum Teil stimmen: In der Gestikforschung sind bislang vor 
allem Handgesten fokussiert worden (vgl. auch die oben angesprochene Be- 
schränkung des Gestikbegriffs auf Hand- und Armbewegungen bei einigen For- 
schern), und dabei ist im Allgemeinen eine klare Aufteilung in Vorbereitung, Hö- 
hepunkt und ggf. Rückzug wahrnehmbar, während das bei Gesten wie 
Kopfschütteln und Nicken als durchaus schwieriger erscheint. Allerdings darf 
diese Beobachtung nicht ohne Weiteres über alle Kopfgesten generalisiert wer- 
den, denn etwa bei Kopfbeats sowie beim Kopfschwenk (‚head sway‘, d. i. die 
Geste, bei der der Kopf einmal mit einer großen waagerechten Ausholbewegung 


4 Traditionell werden Gesten in drei Phasen aufgeteilt: die Vorbereitung (‚preparation‘), den 
Höhepunkt (‚stroke‘), der die eigentliche Bedeutung vermittelt, und den Rückzug (‚recovery‘ o- 
der ‚retraction‘). Wenn der betroffene Artikulator (meist die Hand) beim Höhepunkt gehalten 
wird, bevor der Rückzug angetreten wird, wird dies als ‚stroke hold‘ bezeichnet. 
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zur Seite bewegt wird, vielfach zur Intensivierung) scheint es durchaus möglich 
zu sein, die drei Gestenphasen zu unterscheiden. Bei Kopfschütteln und Nicken 
dagegen wird die ganze Geste als Stroke betrachtet. Dadurch verliert die Unter- 
streichung, die gerade den Stroke von den anderen Gestenphasen unterscheiden 
soll, ihre Bedeutung und wird dementsprechend nicht eingesetzt. 


6 Anmerkungen zur Gestikanalyse 


6.0 Einführung 


Im dritten Kapitel wurde bereits auf den Gestikbegriff und die im Folgenden an- 
gewandte Gestikeinteilung eingegangen. Allerdings zwingen sich an dieser Stelle 
noch einige methodische Angaben zur Gestikanalyse auf. Konkret soll im Ab- 
schnitt 6.1 auf die Zählung der Gesten eingegangen werden, und im Abschnitt 6.2 
soll geklärt werden, nach welchen Parametern die Gesten beschrieben werden. 
Zunächst ist jedoch noch eine allgemeine Anmerkung im Hinblick auf die 
Annotation der Daten angebracht. Da Entscheidungen in diesem Bereich gele- 
gentlich heikel sein können (Ist eine Bewegung ein Beleg einer bestimmten 
Geste? Hat die Geste eine abtönende Bedeutung? Wie lässt sich die Bewegung am 
besten beschreiben? usw.), wird bei Gestikanalysen oft nachgegangen, inwiefern 
mehrere Personen zur gleichen Annotation der Daten kommen; je größer dieses 
sogenannte Interrater-Reliabilität (‚inter-coder agreement‘) ist, umso zuverlässi- 
ger soll die Annotation sein.' Allerdings wird oft lediglich ein Maß für diese Reli- 
abilität geliefert (meist Cohens Kappa), ohne auf die Frage einzugehen, wie mit 
den Fällen umzugehen ist, in denen die Urteile auseinandergehen. Aus diesem 
Grund, und auch weil Cohens Kappa kritikanfällig ist (s. u. a. Gnisci/Maricchiolo/ 
Bonaiuto 2013), wurde in vorliegender Arbeit vielmehr für Interrater-Verifizie- 
rung (‚inter-coder verification‘) optiert: Neben dem Autor haben sich jeweils min- 
destens zwei weitere Personen die Daten angeschaut, und so wurde versucht, zu 
einer möglichst einheitlichen Bestimmung der einzelnen Fälle zu kommen. 


6.1 Zählung der Gesten 


Was die Zählung der Gesten betrifft, ist zunächst anzumerken, dass nur relevante 
Gestik berücksichtigt wird. Es ist zum Beispiel möglich, dass eine Modalpartikel 
in einer Aufzählung vorkommt, etwa wenn in einer Rede mehrere Gründe für eine 


1 Obwohl diese Kontrolle bei monomodal auf die verbale Ebene ausgerichteten Studien eher 
selten vorgenommen wird, kann sie auch dort von Nutzen sein, zum Beispiel für die Entschei- 
dung, ob man es mit einer Modalpartikel oder einem Heterosem zu tun hat, denn tatsächlich ist 
auch diese Grenze nicht immer leicht zu ziehen (vgl. Kapitel 2). 
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Entscheidung aufgelistet werden. In diesem Fall kann es sein, dass der Sprecher 
die Gründe verbal nummeriert (erstens... zweitens... drittens...), und zugleich auch 
mit den Fingern mitzählt (vgl. Abbildung 7). Eine solche Zählgeste dürfte jedoch 
mit der Bedeutung der Modalpartikel wenig zu tun haben, und wird dementspre- 
chend in der Analyse auch nicht berücksichtigt oder gezählt. Wenn also im Fol- 
senden zu einem Partikelbeleg gesagt wird, dass keine Geste vorliegt, so ist damit 
gemeint, dass keine abtönungsliierte Geste vorliegt; sonstige Gesten (wie hier die 
Zählgeste) können durchaus vorkommen.? 


Abb. 7: Zählgesten ‚erstens... zweitens... drittens...‘ (Zeichnungen nach Bressem 2008) 


Eine zweite Anmerkung betrifft die Gesten, die mehrere Dimensionen in sich 
vereinen. Wie bereits im Abschnitt 3.3.3 dargelegt wurde, ist es durchaus mög- 
lich, dass eine Geste nicht direkt in eine der traditionellen Kategorien hinein- 
passt, sondern auf mehreren Dimensionen anzusiedeln ist. So lässt sich eine 
‚Conduit‘-Geste durchaus mit einem intersubjektiven Deiktikum oder einem Beat 
kombinieren. In dem Fall wird nicht versucht, eine dominante Dimension auszu- 
wählen (wie es u. a. Paggio [2012: 288] tut), sondern die Geste wird als Beleg eines 
jeden der Gestikmuster, die sie in sich vereint, betrachtet und gezählt. Es ist also 
möglich, dass eine Geste mehrfach gezählt wird - zumindest wenn die absolute 
Häufigkeit der einzelnen Gestikmuster zu bestimmen ist; bei der Bestimmung des 
Anteils der Partikeln, die von einer Geste begleitet werden, werden komplexe 
Gesten selbstverständlich wie einfache Gesten gezählt. 

Des Weiteren sei kurz angesprochen, wie inhärent repetitive Gesten wie 
Kopfschütteln, Nicken und Beats gezählt werden. Obwohl sich besonders bei 
Beats durchaus verteidigen ließe, dass jede Bewegung nach unten ein ‚Stroke‘ ist, 
wurde nicht jede Auf-und-ab- bzw. Hin-und-her-Bewegung separat gezählt. Statt- 
dessen wurde Frickes (2012: 180) Begriff des ‚stroke phrase‘ angewandt. Mit die- 
sem Begriff bezeichnet Fricke (a. a. O.) „eine im Prinzip beliebig lange Kette ei- 
nander nebengeordneter S [= Strokes]“, ohne Vorbereitung und Rückzug. Damit 


2 Vgl. zum Vorkommen anderer Gesten auch Kapitel 12 zu den Faktoren, die die Distribution der 
abtönenden Gesten bestimmen. Als ‚abtönungsliiert‘ werden alle Gesten eingestuft, die sich auf 
eine der Wirkungsebenen der Modalpartikeln (abtönend, konnektierend und illokutionstypbe- 
zogen) beziehen. 
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ist nicht gemeint, dass diese Gesten keine Vorbereitungs- und Rückzugsphase 
hätten; diese kommen aber erst hinzu, wenn man zur höheren Ebene der ‚gesture 
phrases‘ bzw. der ‚gesture units‘ (Fricke a. a. O.) ansteigt, denn zwischen den ein- 
zelnen Strokes einer ‚stroke phrase‘ sind keine eindeutigen Vorbereitungs- und 
Rückzugsphasen wahrnehmbar. 

Zur Verdeutlichung kann auf die längere Beatsequenz in (1) hingewiesen 
werden. In diesem Auszug produziert der Abgeordnete Peter Westenthaler in sei- 
ner Aufregung eine Äußerungseinheit, die sich über sieben Intonationseinheiten 
ausdehnt, und auch die Beatsequenz, die die Äußerungseinheit begleitet, er- 
streckt sich über diese sieben Intonationseinheiten. Es ist nur eine Beatsequenz, 
die aus insgesamt 29 Einzelbeats bzw. Strokes besteht, aber trotzdem wird sie als 
sieben Beatgesten gezählt, weil es Indizien dafür gibt, dass es sich um sieben 
‚stroke phrases‘ handelt, die aus je drei bis sieben Strokes bestehen. Das wich- 
tigste Indiz für diese Einteilung in sieben ‚stroke phrases‘ ist, dass der Beat, der 
schön dem Sprechrhythmus folgt, am Ende jeder Intonationseinheit kurz ange- 
halten wird (hier zeigt sich nochmals die im vorigen Kapitel angesprochene Über- 
einstimmung von Gestikeinheiten und Intonationseinheiten). Zudem ändert sich 
zweimal die Form der Geste (vgl. Abbildung 8a): Nach Einheit 400 wird der zwei- 
händige Beat mit gekippter ‚Grappolo‘-ähnlicher Form? durch einen einhändigen 
zeigenden Beat ersetzt (der eher waagerecht orientiert ist und also nicht einfach 
die Referenz von hier in Österreich anzeigt), und nach Einheit 402 wird zur 
Grappolo-ähnlichen Form zurückgekehrt, allerdings immer noch einhändig. An- 
ders formuliert, nach der Notationsterminologie von Bressem (2008, 2013b) (vgl. 
Abbildung 8b), wechselt der Sprecher von einem zweihändigen ‚1-5 connected‘ 
zu einem einhändigen ‚2 bent‘, und dann wieder zu einem einhändigen ‚1-5 
connected‘, bei dem allerdings Mittelfinger, Ringfinger und kleiner Finger etwas 
stärker gebogen bleiben als in der Abbildung wiedergegeben, vermutlich durch 
Assimilierung mit der vorangehenden Phase. 


a) PR_West2504 


398 PW {es Ist (-) schlicht und einfach INakzeptabel;} 

399 dass {ein uu Es-amerikanischer FONDS, } 

400 und eine uu Es-amerikanische reGlIErung, } 

401 hIEr uns in ÖSter}reich; 

402 einer in Österreich befindlichen bank in 
österreichischem beSITZ, } 

403 VOR}schreibt- 

404 wEr kunde sein darf und wer NICHT.} 


3 Auf Deutsch wird der Grappolo (vgl. Kendon 2004: 229) gelegentlich als ‚Spitzhand‘ bezeich- 
net (u. a. Weinrich 1992 und Müller 1998, s. auch Abschnitt 9.4). 
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Abb. 8a: Die sich ändernde Beatform in (1) (links = Einheit 398; Mitte = Einheit 401; rechts = 
Einheit 404) 


Abb. 8b: Die Handformen aus Abb.8a im System von Bressem (‚1-5 connected‘, ‚2 bent‘, ‚1-5 
connected‘) 


Wie sich in diesem Beispiel zeigt, können sich die einzelnen Belege bzw. In- 
stanziierungen einer Geste erheblich voneinander unterscheiden. Im Fall der 
Beats soll das nicht allzu sehr wundern, da diese Kategorie nur sehr allgemein 
definiert ist und häufig mit Gesten anderer Dimensionen kombiniert wird (vgl. 
oben). Allerdings sind auch die Realisierungen genauer definierter Gestikmuster 
selten oder nie identisch.‘ Dazu schreibt Harrison (2009: 82): 


Of course, no two tokens of a gesture are ever identical; as we can distinguish between “lin- 
guistic expression’ and ‘usage event’ or ‘type’ and ‘token’ for vocalizations, we can also 
distinguish between types and tokens in gestures. 


Tatsächlich ist es möglich, über sich ähnelnde Einzelbelege zu abstrahieren 
und diese als Instanziierungen derselben Geste zu betrachten (ähnlich, wie auch 
Konstruktion Abstrahierungen über Einzelkonstrukte sind). Im Hinblick auf 
diese Ähnlichkeit zwischen Einzelbelegen von Gesten sind u. a. die im nächsten 
Abschnitt anzusprechenden Annotationsparameter von Nutzen. 


4 Faktoren, die hier eine Rolle spielen dürften, sind u. a. der verfügbare Gestenraum, der auch 
die Distribution der Gesten im Allgemeinen beeinflusst (vgl. Kapitel 12), und Interferenzen mit 
anderen Gesten, insbesondere mit der direkt vorangehenden. 
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6.2 Beschreibung der Gesten 


Ähnlich, wie es für die Transkription gesprochener Sprache mehrere Konventio- 
nen gibt (vgl. Abschnitt 5.2), kursieren auch für die Beschreibung und Annotation 
von Gesten mehrere Systeme (siehe Bressem 2013a für eine Übersicht). Allerdings 
beziehen sich diese vor allem auf Hand- und Armgesten, was erneut darauf zu- 
rückzuführen sein dürfte, dass bislang in der Gestikforschung vor allem Bewe- 
gungen der Hände und Arme im Zentrum der Beobachtung gestanden haben. Die 
Annotationssysteme für Hand- und Armgestik sind jedoch nicht ohne Weiteres 
auch für Kopfgesten einsetzbar: Zum einen stimmt der Gestenraum des Kopfes 
nicht mit jenem der Hände/Arme überein, und zum anderen unterliegt der Kopf 
anderen Bewegungsrestriktionen. Daher werden im Folgenden die Kopfgesten 
und die Hand- und Armgesten separat besprochen. 


6.2.1 Hand- und Armgesten 


Für die Beschreibung von Hand- und Armgesten sind nach Ladewig/Bressem 
(2013) vier Faktoren bzw. Parameter heranzuziehen (ähnlich auch u. a. Martell 
2005 und Mittelberg 2007): die Form der Hand, die Orientierung der Hand, die 
Art der Bewegung und die Position im Gestenraum. In dieser Reihenfolge werden 
diese vier Faktoren hier angesprochen; eine zusammenfassende Übersicht findet 
sich im Anhang. 


6.2.1.1 Handform 

Als erste Facette der Form ist mit Bressem (2008: 11) festzuhalten, dass angege- 
ben werden soll, ob die Geste einhändig oder zweihändig realisiert wird, und im 
ersteren Fall, ob sie mit der linken oder mit der rechten Hand produziert wird 
(ähnlich auch McNeill 1992: 379). Allerdings ist dieser Aspekt für die folgende 
Analyse meist von geringerer Wichtigkeit, sodass nicht systematisch darauf ver- 
wiesen wird.’ 

Was die Form der verwendeten Hand (bzw. Hände) an sich betrifft, besteht 
bislang kein einheitliches Annotationssystem. McNeill (1992), zum Beispiel, ver- 
weist auf die Handformen des Fingeralphabets in Amerikanischer Gebärdenspra- 
che. Demgegenüber stehen Forscher wie Bressem (2008, 2013b), die ein eigenes 


5 Zudem spielt hier auch die Links- oder Rechtshändigkeit des Sprechers eine Rolle (vgl. zum 
Beispiel bereits Kimura 1973), die allerdings für die verwendeten Korpusdaten nicht systema- 
tisch nachvollziehbar ist. 
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Notationssystem ausgearbeitet haben. Bressem geht von vier Basisformen aus: 
Faust (‚fist‘), flache Hand (‚flat hand‘), Einzelfinger (‚single fingers‘) und kombi- 
nierte Finger (‚combination of fingers‘) (Abbildung 9a). In den beiden letzten Fäl- 
len ist zusätzlich zu klären, welche Finger betroffen sind und welche Haltung sie 
annehmen: gestreckt (‚stretched‘), gebogen (,bent‘), gekrümmt (‚crooked‘), nach 
innen geklappt (‚flapped down‘)°, verbunden (‚connected‘) oder berührend (,tou- 
ching‘) (Abbildung 9b); im Fall der flachen Hand ist anzugeben, ob die Finger 
völlig gestreckt oder leicht gebogen sind und ob sie direkt nebeneinander gehal- 
ten werden oder doch leicht gegrätscht sind. 


1. “Fist” 2. “Flat hand” 3. “Single fingers” 4. “Combinations of fingers” 
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Abb. 9a: Die Basishandformen nach Bressem (2008, 2013b) 


stretched bent crooked flapped down connected touching 
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Abb. 9b: Die möglichen Haltungen der Finger nach Bressem (2008, 2013b) 


Darüber hinaus haben bestimmte Handformen (bzw. manchmal die Gesten 
als Ganzes) in der Literatur auch einen spezifischen Namen erhalten, der vielfach 
zwar etwas über die Form aussagt, allerdings meist nicht einem Notationssystem 
wie dem von Bressem (2008, 2013b) entstammt. Beispiele sind die oben bereits 
angesprochene Spitzhand (,Grappolo‘) und die sogenannte Ring-Form, die sich 
mit Bressem als ‚1+2 connected‘ umschreiben ließe (Abbildung 10a).’ Da die im 
Analyseteil der Arbeit zu beschreibenden Gesten meist einen solchen gängigeren 


6 ‚Flapped down‘ wird hier als ‚nach innen geklappt‘ übersetzt, da eine wörtliche Übersetzung 
als ‚runtergeklappt‘ m. E. irreführend wäre: Wenn die Handfläche waagerecht nach oben gehal- 
ten wird, zeigen die Finger, wenn sie ‚flapped down‘ sind, nach oben und nicht nach unten. 

7 Die Zahlenangaben stehen für die Finger, die sich berühren (1-5 = alle Finger, 1+2 = Daumen 
und Zeigefinger). 
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Namen haben, werden vor allem diese Bezeichnungen verwendet; auf das Nota- 
tionssystem von Bressem wird nur in Einzelfällen hingewiesen. Neben der Spitz- 
hand und der Ringhand handelt es sich insbesondere um die flache Hand, die 
Schüsselhand (‚plate hand‘, eine flache Hand mit leicht gebogenen Fingern’, vgl. 
Bressems ‚lax flat hand‘), und das Fingerzeigen (Zeigegeste mit einem gestreck- 
ten Finger; typischerweise Bressems ‚2 stretched‘). 


Abb. 10a: Spitzhand und Ring nach Kendon (1995: 250, 268) 
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Abb. 10b: Flache Hand, ‚lax flat hand‘ und ‚2 stretched‘ nach Bressem (2008, 2013b) 
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6.2.1.2 Handorientierung 

Was die Orientierung der Hände betrifft, sind im Grunde genommen zwei Aspekte 
zu erwähnen: die Orientierung der Handfläche und die Orientierung der Finger. 
Dieser Unterschied ist aus zwei Gründen wichtig: Zum einen liegen die Handflä- 
che und die Finger nicht immer in einer Linie (zum Beispiel, wenn die Finger ge- 
bogen oder nach innen geklappt sind), und zum anderen sagt die Palmorientie- 
rung auch nicht alles aus (zeigen etwa bei ‚palm up‘ die Finger eher nach vorne 
oder doch eher zur Seite?). Die möglichen Orientierungen sind aber die gleichen, 
sodass hier nur die Richtungen aufgelistet werden, ohne Unterschied zwischen 
Fingern und Handflächen. 

Das gängigste System zur Beschreibung der Orientierung ist das von McNeill 
(1992, 2005) vorgeschlagene. Auch Bressems (2008, 2013b) System ist sehr stark 
an McNeill orientiert, aber etwas differenzierter. McNeill listet sechs Möglichkei- 
ten auf: dem Körper zugewandt, vom Körper abgewandt, dem Mittelpunkt des 
Gestenraums zugewandt, vom Mittelpunkt des Gestenraums abgewandt, nach 


8 Allerdings sind die Finger weniger stark gekrümmt als bei der Topfhand (‚cupped hand‘), die 
mit ‚1-5 bent‘ in Bressems Notationssystem übereinstimmt. 
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oben gewandt und nach unten gewandt. Bressem dagegen, die eigentlich nur die 
Orientierung der Handfläche explizit anspricht, hat vier Hauptorientierungen: 
nach oben, nach unten, Handfläche lateral (d. h. senkrecht mit den Fingern nach 
vorne oder zur Seite gerichtet), und Handfläche senkrecht (mit den Fingern nach 
oben oder nach unten gerichtet). In den beiden letzteren Fällen differenziert sie 
dann weiter, je nachdem, ob die Handfläche dem Körper zugewandt, vom Körper 
abgewandt, dem Mittelpunkt des Gestenraums zugewandt oder vom Mittelpunkt 
des Gestenraums abgewandt ist. Zusätzlich erwähnt Bressem expliziter als 
McNeill (der diese Möglichkeit nicht auflistet, allerdings auch nicht ausschließt) 
die Möglichkeit einer diagonalen Haltung der Hand. Dementsprechend gibt es 
auch weitere mögliche Orientierungen wie ‚palm up-center‘, bei dem die Hand- 
fläche zwar nach oben gerichtet ist, allerdings nicht ganz waagerecht gehalten 
wird, sondern leicht zum Mittelpunkt des Gestenraums hin orientiert ist. 

Schließlich sei noch kurz auf die Frage eingegangen, wie die Orientierungs- 
angaben zu verstehen sind. Dieser Aspekt wird vielfach eher implizit gelassen, ist 
jedoch für ein richtiges Verständnis der Angaben unerlässlich. Bei der Handflä- 
che wird die Orientierung auf eine imaginäre Linie abgestimmt, die lotrecht auf 
der Handfläche steht. Wenn es heißt, dass die Handfläche nach oben gewandt 
ist, so heißt das, dass diese imaginäre Linie senkrecht nach oben zeigt; die Hand- 
fläche befindet sich lotrecht auf dieser Linie und ist also waagerecht. Bei den Fin- 
gern dagegen folgt die imaginäre Linie der Richtung der Finger selbst und steht 
nicht lotrecht darauf. Wenn also zu den Fingern gesagt wird, dass sie nach oben 
gerichtet sind, so sind es die Fingerspitzen (und nicht die Innenseite der Finger, 
wie bei der Handfläche), die nach oben zeigen. 


6.2.1.3 Bewegung 

Was die Bewegung betrifft, unterscheidet Bressem (2008, 2013b) drei Parameter: 
Typ, Richtung und Charakter. Im Anschluss an Harrison (2009: 70) ließe sich 
noch ein vierter hinzufügen: Zahl. 

Der letzte Parameter ist am einfachsten zu beschreiben: Es handelt sich um 
die Frage, ob die Geste wiederholt wird oder nicht. Dies ist nicht nur für diejeni- 
gen Gesten relevant, die von sich aus häufig iterativ sind (etwa Beats): Auch an- 
dere Gesten können durch Wiederholung (wie auch durch andere Faktoren, zum 
Beispiel eine größere Realisierung) besonderen Nachdruck bekommen (u. a. Ba- 
velas 1994: 204). 

Der Bewegungstyp kann im Prinzip aus zwei Perspektiven beschrieben wer- 
den: ausgehend von den Gelenken, die die Bewegung hervorbringen, oder aus- 
gehend von der Versetzung im Raum, die die Hand im Endeffekt durchmacht. 
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Erstere Perspektive findet man zum Beispiel im vom Ursprung her an Gebärden- 
sprachen orientierten morphodynamischen Modell Boutets (u. a. 2008) (vgl. auch 
Sager 2005), aber auch Bressem (2008, 2013b) vertritt sie, wenn sie die Bewe- 
gungsfreiheit des Handgelenks anspricht. Ansonsten optiert Bressem für die an- 
dere Perspektive und unterscheidet sechs Haupttypen der Bewegung: gerade, bo- 
genförmig, kreisförmig, zickzack, schlängelnd und spiralförmig. Für vorliegende 
Arbeit ist letztere Perspektive die wichtigere, sodass an dieser Stelle nicht weiter 
auf die gelenkorientierte morphodynamische Perspektive eingegangen wird. 

Für die versetzungsorientierte Perspektive ist auch der dritte Bewegungspa- 
rameter relevant: die Richtung. Im Normalfall ist der Gestenraum als dreidimen- 
sional zu betrachten. Dementsprechend sind mit Bressem (2008, 2013b) Bewe- 
gungen auf einer jeden dieser drei Dimensionen (nach links/rechts, nach 
oben/unten und nach vorne/hinten bzw. auf den Sprecher zu/vom Sprecher weg) 
sowie diagonale Bewegungen auf mehreren dieser Dimensionen zugleich zu un- 
terscheiden. Für kreisförmige Bewegungen kommt auch noch der Sinn der Bewe- 
gung (im Uhrzeigersinn bzw. entgegen dem Uhrzeigersinn) hinzu. 

Der letzte Bewegungsparameter, der Charakter der Bewegung, betrifft Fakto- 
ren wie die Größe (bzw. den Umfang oder die Amplitude), die Schnelligkeit bzw. 
Dauer und die Flüssigkeit der Bewegung. Auf diesen Dimensionen sind keine so 
deutlichen Grundwerte definiert wie bei den vorigen Parametern, weil es schwie- 
riger ist, zu bestimmen, wann eine Geste zum Beispiel schnell oder langsam rea- 
lisiert wird. Dementsprechend fügt Bressem (2008: 18) hinzu, dass diese Aspekte 
der Geste nur angesprochen werden, wenn sie als auffällig oder markiert perzi- 
piert werden. 


6.2.1.4 Position 
Als letzter Parameter ist noch die Position der Geste anzusprechen, d.h. die Stelle 
im Gestenraum, an der sie realisiert wird. Diese Position kann aus drei Perspekti- 
ven bestimmt werden: relativ zum Körper bzw. zum Gestenraum des Sprechers, 
relativ zum Körper bzw. zum Gestenraum des Hörers, und relativ zur Position an- 
derer (vorangehender oder folgender) Gesten desselben Sprechers (Mittelberg 
2007: 239). In der Literatur wird meistens die erste Perspektive eingenommen, 
und es ist m. W. auch die einzige, die systematisch in Notationssystemen ausge- 
arbeitet wurde. Auch im Folgenden steht diese sprecherorientiere Perspektive im 
Zentrum der Beobachtung, sodass an dieser Stelle nur die Notation aus dieser 
Perspektive vorgestellt wird. 

Ähnlich wie im Falle der Handorientierung kann auch für die Position 
McNeills (1992, 2005) Ansatz als ziemlich einflussreich gelten, denn erneut gehen 
Forscher wie Bressem (2008, 2013b) beim Aufstellen ihrer Annotation von seinem 
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System aus. McNeill teilt den Gestenraum des Sprechers in unterschiedliche Zo- 
nen auf, die in Abbildung 11 schematisch wiedergegeben werden. 


EXTREME 
PERIPHERY 


iji CENTER- 
CENTER 


Abb. 11: Zonen im Gestenraum nach McNeill (1992: 89) 


Eine andere Herangehensweise verwenden Kipp/Neff/Albrecht (2007) (vgl. 
Abbildung 12). Sie gehen nicht vom Gestenraum an sich aus, sondern vielmehr 
von der Haltung der Hände bzw. Arme vis-à-vis dem Körper des Sprechers. Sie 
schlagen eine dreidimensionale Einteilung vor, die auf den ersten Blick konkreter 
erscheinen dürfte als McNeills Finteilung, da sie zum Teil auf deutlichen Merk- 
punkten am Körper beruht. Allerdings ist etwa die Grenze zwischen ‚out‘ und ‚far 
out‘ oder ‚abdomen‘ und ‚belt‘ bei Kipp/Neff/Albrecht genauso vage wie die 
Grenze zwischen (einfacher) Peripherie und extremer Peripherie bei McNeill. 

Immerhin ist die Einteilung von Kipp/Neff/Albrecht als reicher zu betrachten 
als McNeills Aufteilung des Gestenraums. Neben den beiden Dimensionen der 
Höhe (‚height‘) und Radiusorientierung (‚radial orientation‘), die eine ähnliche 
Positionsbeschreibung ermöglichen wie McNeills zweidimensionales Modell, un- 
terscheiden sie noch eine dritte Dimension: die Distanz (‚distance‘) zum Körper.? 


9 Darüber hinaus listen Kipp/Neff/Albrecht als vierte Dimension den ‚arm swivel‘ auf, d. h. die 
Haltung des Oberarms (direkt neben dem Körper, leicht vom Körper entfernt, waagerecht usw.). 
Diese Dimension ist für die folgende Analyse von geringerer Wichtigkeit und bleibt deshalb auch 
an dieser Stelle außer Betracht. 


Beschreibung der Gesten — 105 


Es ist tatsächlich ein Nachteil der Einteilung McNeills, dass er die ‚Tiefe‘ des Ges- 
tenraums nicht mitberücksichtigt. Dies wurde auch schon von anderen For- 
schern erkannt (u. a. Bressem 2008, 2013b und Harrison 2009). Ähnlich wie 
Kipp/Neff/Albrecht haben Bressem und Harrison vier mögliche Distanzen unter- 
schieden, die trotz unterschiedlicher Bezeichnungen weitestgehend miteinander 
übereinstimmen (vgl. Tabelle 2). 


Tab. 2: Unterschiedliche Bezeichnungen der Werte auf der Distanzdimension 


Kipp et al. (2007) Bressem (2008, 2013b) Harrison (2009) 

touch speaker’s own body on body 

close close distance to the body at body 

normal middle distance from the body at elbow length 

far far distance from the body at arm’s length 
HEIGHT DISTANCE 


FAR 
ABOVE HEAD 
HEAD 
SHOULDER 2 NORMAL 
CHEST 
ABDOMEN È 
BELT 


BELOW BELT 
TOUCH 
laaa RADIAL ORIENTATION 
FAR OUT 
INWARD 
out FRONT 


SIDE 


Abb. 12: Position im Gestenraum nach Kipp/Neff/Albrecht (2007: 332) 
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Der Vollständigkeit halber sei erwähnt, dass Bressem und Harrison diese Po- 
sitionen auf der Tiefendimension auch nummerieren: Dimension 0 ist, was Kipp/ 
Neff/Albrecht ‚touch‘ nennen, Dimension 1 ist ‚close‘, Dimension 2 ist ‚normal‘ 
und Dimension 3 ist ‚far‘. Bressem fügt außerdem die Möglichkeit negativer Werte 
auf dieser Distanzachse hinzu, wenn sich die Hand hinter dem Körper befindet. 
Dies dürfte zwar weniger häufig vorkommen, aber etwa bei Ausholbewegungen 
ist es nicht ausgeschlossen, dass der ‚Stroke‘ des Ausholens hinter dem Körper 
anfängt. Bei den in den folgenden Kapiteln zu besprechenden Gesten kommt 
diese Situation jedoch nicht vor. 

Streng genommen ist neben der zweidimensionalen Natur noch eine weitere 
Unvollkommenheit von McNeills Modell bzw. insbesondere seiner grafischen 
Darstellung zu erwähnen. Die Grafik in Abbildung 11 zeigt, dass McNeill die Zo- 
nen im Gestenraum mit Rechtecken andeutet. Allerdings ist der Gestenraum ei- 
gentlich als eine Sphäre zu sehen (Priesters/Mittelberg 2013). Dies betrifft sowohl 
die Distanzdimension als auch die beiden von McNeill berücksichtigten Dimen- 
sionen. Allerdings repräsentieren die Linien in McNeills Zeichnung wohl auch 
keine scharfen Grenzen, sondern vielmehr Übergangszonen, denn es ist tatsäch- 
lich nicht immer leicht zu bestimmen, wo zum Beispiel die Peripherie aufhört und 
die extreme Peripherie anfängt. In der Hinsicht ist also eine gewisse Vagheit der 
Grenzen impliziert, die es ermöglicht, die sphärische Natur des Gestenraums we- 
nigstens zum Teil mit McNeills rechteckigen Zonen zu vereinigen. Obwohl eine 
Variante von McNeills Modell mit gerundeten Zonen also eher der Wirklichkeit 
entsprechen dürfte, ist also das rechteckige Modell nicht ganz zu verwerfen. 

Aus diesem Grund wird im Folgenden doch von McNeills Einteilung des Ges- 
tenraums ausgegangen, zumal sie gängiger ist als die von Kipp/Neff/Albrecht 
vorgeschlagene Alternative. Im Anschluss an die in Tabelle 2 angesprochenen 
Arbeiten wird diese Einteilung jedoch auch in vorliegender Arbeit um eine Dis- 
tanzdimension ergänzt. Die von Kipp/Neff/Albrecht eingeführten Bezeichnun- 
gen auf den Dimensionen der Höhe und der Radiusorientierung werden gelegent- 
lich zu Vergleichszwecken bzw. zur Verdeutlichung herangezogen, bilden aber 
nicht den Ausgangspunkt für die Beschreibungen im Folgenden. 


6.2.2 Kopfgesten 


Kopfgesten haben in der bisherigen Gestikforschung weniger Beachtung gefun- 
den als Hand- und Armgesten. Dementsprechend sind für Kopfgesten noch keine 
so detaillierten Annotationssysteme ausgearbeitet worden. Außerdem sind die 
oben für Hand- und Armgesten aufgelisteten Parameter für Kopfgesten nicht alle 
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gleich relevant. Die Position im Gestenraum, zum Beispiel, ist für Kopfgesten 
keine so prominente Dimension wie für Hand- und Armgesten, da der Gesten- 
raum des Kopfes aufgrund der beschränkteren Bewegungsfreiheit im Vergleich 
zu den Händen und Armen wesentlich kleiner ist. Ähnlich ist die Formdimension 
beim Kopf weniger ausgearbeitet, da der Kopf weniger Gelenke enthält als die 
Hände und dementsprechend weniger unterschiedliche Formen annehmen 
kann." 

Durchaus relevant sind dagegen die beiden anderen Faktoren, Orientierung 
und Bewegung. Bei der Orientierung dürfte es eine Rolle spielen, ob man die 
Geste mit erhobenem, gesenktem oder neutral gehaltenem Kopf realisiert, ob 
man den Kopf gerade hält oder doch eher schräg zur Seite geneigt (‚tilted‘), und 
ob man vor sich hin schaut oder den Kopf eher zur Seite gewandt hat. Die Haltung 
des Kopfes wird zum Teil dadurch bestimmt, wo sich der Gesprächspartner befin- 
det, kann allerdings auch mit der Geste zusammenhängen, zum Beispiel wenn 
man aus Ratlosigkeit den Kopf schüttelt und zugleich gen Himmel schaut. 

Was die Bewegung betrifft, unterscheidet Harrison (2009: 70) drei für Kopf- 
gesten potenziell relevante Parameter: Richtung, Zahl und Charakter. Dies 
stimmt weitgehend mit den Parametern überein, die im Abschnitt 6.2.1.3 für 
Handsgesten aufgelistet wurden. Allerdings ließe sich Harrisons Triade m. E. auch 
der vierte für Handgesten erwähnte Parameter hinzufügen: der Bewegungstyp. 
Auch auf dieser Ebene sind die Möglichkeiten bei Kopfgesten wesentlich be- 
schränkter als bei Hand- und Armgesten, aber zu unterscheiden wären doch zu- 
mindest gradlinige und bogenförmige Bewegungen. Für die anderen Parameter 
laufen die Möglichkeiten weitgehend mit denen für Hand- und Armgesten paral- 
lel: Die Richtung ist senkrecht, waagerecht (nach vorne/hinten oder zur Seite) 
oder schräg, die Zahl wird durch Zählung bestimmt (mit als Hauptunterschied 
einfach versus wiederholt), und der Charakter betrifft Aspekte wie Größe, Ge- 
schwindigkeit und Flüssigkeit, die insbesondere dann explizit erwähnt werden, 
wenn sie als auffällig oder markiert perzipiert werden. 


6.2.3 Gesten mit anderen Körperteilen 


In Kapitel 3 wurde behauptet, dass Gesten im Prinzip mit jedem beliebigen Kör- 
perteil realisiert werden können, dessen Beweglichkeit dafür ausreicht. Zweifels- 


10 Es sei denn, dass man die Mimik zur Gestik zähle, was jedoch im Allgemeinen (wie auch im 
Folgenden) nicht gemacht wird. 
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ohne wird (zumindest im Deutschen bzw. verallgemeinernd in den westeuropäi- 
schen Kulturen) die große Mehrheit der Gesten mit den Händen und dem Kopf 
realisiert, aber es ist auch möglich, Zeigegesten etwa mit dem Fuß zu produzie- 
ren, und auch das Achselzucken ist noch separat aufzulisten als Schultergeste. 

All diese Gesten unterliegen eigenen Restriktionen, die hauptsächlich auf die 
Bewegungsfreiheit der einbezogenen Gelenke zurückzuführen sind. Wie sich 
auch für die Kopfgesten gezeigt hat, wirken sich diese Restriktionen auf die für 
die Hand- und Armgesten beschriebenen Notationsparameter aus. So sind zum 
Beispiel die Formmöglichkeiten bei den Fußgesten schon alleine aus dem Grund 
beschränkter als bei den Handgesten, weil es physisch unmöglich ist, eine eben- 
bürtige Formenvielfalt zu realisieren, und eine Fußgeste im Gestenraum der 
Hände zu machen ist alleine schon aufgrund der körperlichen Schwierigkeit un- 
wahrscheinlich (es sei denn, man gehe von einer sehr breiten unteren extremen 
Peripherie aus, die weiter reicht als die Kinesphäre'' der Hände). 

Da diese Gesten bislang weniger erforscht sind, soll es nicht wundern, dass 
auch für die Notation noch kein System wie für die Hand- und Armgesten und die 
Kopfgesten ausgearbeitet wurde. Vorliegende Arbeit ist auch nicht die angewie- 
sene Stelle für ein solches Unternehmen, zumal die untersuchten Gesten bis auf 
das Achselzucken alle mit den Händen (bzw. Armen) oder dem Kopf realisiert 
werden. Für das Achselzucken ist allerdings auf Sager (2005: 33f.) hinzuweisen, 
der einige Angaben zu den möglichen Bewegungstypen macht, allerdings aus ge- 
lenkorientierter, d. h. morphodynamischer Sicht. Er gibt an, dass die Schultern 
gehoben bzw. gesenkt und nach vorne gespreizt bzw. nach hinten gezogen wer- 
den können. Alle diese Bewegungen können mit den beiden Schultern zusam- 
men oder separat realisiert werden. Im Falle des Achselzuckens handelt es sich 
also um ein Heben der Schulter(n), also um eine gradlinige Bewegung nach oben 
(und oft auch leicht schräg nach vorne). Diese Möglichkeit ist also gewiss zu den 
Bewegungsoptionen für Schultergesten zu zählen. Wie bereits angedeutet, ist es 
allerdings nicht möglich, diese Beobachtung im Rahmen der vorliegenden Arbeit 
weiter zu einem detaillierten Notationssystem auszuarbeiten, wie es u. a. McNeill 
(1992, 2005), Kipp/Neff/Albrecht (2007) und Bressem (2008, 2013b) für die Hand- 
und Armgesten gemacht haben. 


11 Der Begriff ‚Kinesphäre‘ (‚kinesphere‘) wurde von Laban (1966: 10) definiert als der „space 
which can be reached by easily extended limbs.“ 
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7.0 Einführung 


Wie interagieren Gesten mit Modalpartikeln bzw. welche Rolle spielen Gesten bei 
der Vermittlung von Abtönungsbedeutungen, wie sie auch durch Modalpartikeln 
ausgedrückt werden? Um dieser Frage auf den Grund gehen zu können, sollte 
man zunächst über eine Übersicht der Muster in der Kookkurrenz von Modalpar- 
tikeln und Gesten verfügen. Eine solche zu liefern ist das Ziel der Kapitel 7-10. 

Da die Abtönungsfunktion der Modalpartikeln im Zentrum der vorliegenden 
Arbeit steht, soll auch denjenigen Gesten, die selber eine abtönende Bedeutung 
aufweisen (und die im Folgenden als ‚abtönende Gesten‘ bezeichnet werden), die 
meiste Aufmerksamkeit gewidmet werden. Konkret sollen in diesem und dem 
nächsten Kapitel zwei ausführlichere Fallstudien präsentiert werden, in denen 
jeweils auf die abtönende Wirkung einer Geste sowie auf ihr gemeinsames Auf- 
treten mit einer bestimmten Modalpartikel eingegangen wird. Es handelt sich 
zum einen um das Kopfschütteln (Kapitel 7), mit einem kurzen Exkurs zum Ni- 
cken, und zum anderen um das sogenannte intersubjektive Deiktikum (Kapitel 
8). Im Anschluss (Kapitel 9) werden weitere abtönende Gesten vorgestellt, die 
ebenfalls im Korpus belegt sind, jedoch aus unterschiedlichen Gründen nicht so 
eingehend analysiert werden können, aber trotzdem für die weitere Diskussion 
in den Kapiteln 11-14 relevant sind. Kapitel 10 enthält eine Besprechung der sel- 
ber nicht abtönenden Gesten, die mit Modalpartikeln korrelieren können. 


7.1 Abtönendes Kopfschütteln'! 


Die erste Geste, die einer genaueren Betrachtung unterzogen wird, ist das Kopf- 
schütteln. Dabei soll insbesondere auf die Kookkurrenz mit der Partikel einfach 
eingegangen werden (7.2). Tatsächlich weisen diese Partikel und das Kopfschüt- 
teln beachtliche Übereinstimmungen auf, wie im Abschnitt 7.2.1 gezeigt werden 


1 In Schoonjans/Bröne/Feyaerts (2015) wurde dieses Kopfschütteln noch als ‚pragmatisches 
Kopfschütteln‘ bezeichnet. Diese Bezeichnung wird hier nicht weiter verwendet, da der Begriff 
‚pragmatisch‘ auch auf andere Verwendungen des Kopfschüttelns zutreffen dürfte. Sofern nicht 
anders angegeben, ist im Folgenden immer das abtönende Kopfschütteln gemeint, wenn einfach 
von ‚Kopfschütteln‘ die Rede ist. 
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soll. Der Vollständigkeit halber wird allerdings auch kurz auf die anderen Ver- 
wendungskontexte des abtönenden Kopfschüttelns eingegangen (7.3) und zum 
Schluss (7.4) wird ein kurzer Vergleich mit der abtönenden Verwendung des Ni- 
ckens geliefert. 

Das Kopfschütteln ist eine Geste, die in der Literatur schon für mehrere Spra- 
chen besprochen wurde (u. a. McClave 2000 fürs Englische, Kendon 2002 fürs 
Englische und Italienische, Calbris 2011 fürs Französische). Im Anschluss an Ken- 
don (2002: 149) ist in der vorliegenden Arbeit von Kopfschütteln die Rede, „when- 
ever the actor rotates the head horizontally, either to the left or to the right, and 
back again, one or more times, the head always returning finally to the position 
it was in at the start of the movement.“ Wichtig ist, das Kopfschütteln vom Kopf- 
schwenk (‚head sway‘) zu unterscheiden: Beim Kopfschütteln handelt es sich um 
eine meist iterative Bewegung („one or more times“), die sich nicht so eindeutig 
in die klassischen Gestikphasen (Vorbereitung, Stroke und Rückzug) aufteilen 
lässt, während es sich beim Kopfschwenk um eine große Ausholbewegung han- 
delt, bei der durchaus eine Vorbereitungs- und eine Rückzugsphase zu unter- 
scheiden sind. Außerdem ist die Amplitude der Bewegung bzw. die Distanz zwi- 
schen den Extremkinen? beim Kopfschwenk im Allgemeinen größer als beim 
Kopfschütteln. 

Wie bereits erwähnt, sind die oben angesprochenen Studien von Calbris, 
Kendon und McClave nicht auf das Deutsche ausgerichtet. Obwohl konventiona- 
lisierte Gesten durchaus sprach- bzw. kulturspezifisch sein können (vgl. Kapitel 
3), legen die Daten nahe, dass die Verwendung des Kopfschüttelns im Deutschen 
mit seiner Verwendung im Englischen, Französischen und Italienischen beacht- 
liche Übereinstimmungen aufweist. 

In westeuropäischen Kulturen ist das Kopfschütteln vor allem als das Emb- 
lem der Negation bekannt. Allerdings haben McClave (2000) und Kendon (2002) 
weitere Verwendungen des Kopfschüttelns nachgewiesen. Es könne zum Beispiel 
eingesetzt werden, um eine Äußerung zu intensivieren oder um sie als Beurtei- 
lung (‚assessment‘) zu markieren. Darüber hinaus könne es Unsicherheit oder 
Zweifel beim Sprecher markieren, oder gerade andeuten, dass dem Sprecher zu- 
folge das Gesagte ausnahmslos zutrifft. Vor allem letztere Verwendung lässt sich 
mit Abtönung verknüpfen, da sie an die Evidenzbedeutung der Partikeln des 
Clusters 2b erinnert (vgl. Trömel-Plötz 1979: 321: „Durch die Modifizierung mit 


2 Als Extremkine bezeichnet Sager (2005: 26) die Maximalpunkte der Bewegungsamplitude 
bzw. die Umkehrpunkte der Bewegung. 
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eben wird der Status der Behauptung geändert: die Behauptung wird zur katego- 
rischen, axiomatischen Aussage, die unmittelbar evident, allgemein gültig und für 
alle Zeiten zutreffend ist.“ — meine Hervorhebung). 

Es ist kein Zufall, dass diese Bedeutungen durch eine Form ausgedrückt wer- 
den, die vom Ursprung her der Ausdruck einer Negation ist. Tatsächlich geht Ken- 
don (2002) davon aus, dass in diesen Fällen auch eine Art implizierte Negation 
nachzuweisen ist. Das suggerieren auch Paraphrasen wie ‚ich weiß nicht genau‘ 
bzw. ‚ich bin mir nicht sicher‘ für die Zweifelsbedeutung oder ‚ich wüsste nicht, 
was noch weiter dazu zu sagen wäre‘, ‚ich sehe nicht, wie es anders sein könnte‘ 
und ‚ich sehe keine andere Möglichkeit‘ für die Ausnahmslosigkeitsbedeutung, 
wie sie auch Kendon selber vorschlägt.? 

Allerdings kann man nicht sagen, dass es sich hier noch um eine reine Nega- 
tionsgeste handle. Dies zeigt sich unter anderem darin, dass sie in eindeutig po- 
sitiven Kontexten eingesetzt werden kann (wie sich auch in den Beispielen im 
Folgenden noch zeigen wird). Für das emblematisch-negierende Kopfschütteln 
hat Kendon (2002) zwar nachgewiesen, dass es mit positiven Äußerungen ver- 
wendet werden kann, wenn diese Äußerung einer Vorgängeräußerung wider- 
spricht (und sie somit eigentlich negiert) oder eine negative Antwort auf eine Vor- 
sängerfrage impliziert, aber auch das scheint bei der Ausnahmslosigkeits- 
bedeutung nicht (bzw. zumindest nicht immer) der Fall zu sein. 

In der Hinsicht ließe sich die These formulieren, dass sich letztere Verwen- 
dung des Kopfschüttelns durch Grammatikalisiertung aus dem emblematisch- 
negierenden Kopfschütteln entwickelt hat. Dafür würde auch sprechen, dass das 
Kopfschütteln in diesem Fall im Allgemeinen eine beschränktere Amplitude auf- 
zuweisen scheint als das emblematisch-negierende Kopfschütteln (diese Be- 
obachtung bedarf allerdings noch weiterer Verifizierung, zumal sich die Frage 
stellt, ob nicht auch innerhalb der Kategorie des emblematisch-negierenden 
Kopfschüttelns - in Anlehnung etwa an Kendon (2002) - weitere Subkategorien 
zu identifizieren sind, die eine unterschiedliche prototypische Amplitude aufwei- 
sen). Die Grammatikalisierungsthese würde auch erläutern, wieso eine vom Ur- 
sprung her negierende Form auch Verwendungen aufweist, in denen die Negati- 
onsbedeutung stark verblasst (und nur noch in den Paraphrasen deutlich 
wahrnehmbar) ist. Auf die Grammatikalisierungsfrage soll in Kapitel 13 ausführ- 
licher eingegangen werden. 


3 Zugleich verbinden diese Paraphrasen das Kopfschütteln mit dem Achselzucken und dem 
‚Shrug‘, den typischen Zeichen des Nichtwissens. Darauf soll in den Abschnitten 9.2 und 11.1.3 
ausführlicher eingegangen werden. 
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7.2 Kopfschütteln und einfach 


7.2.1 Funktionale Übereinstimmung 


Die im vorigen Abschnitt gelieferte Übersicht der Verwendungen des Kopfschüt- 
telns enthält einige Elemente, die an die Funktionsbeschreibung des Partikel- 
clusters 2b im Abschnitt 2.3.3 erinnern. Da das Kopfschütteln im Korpus vor allem 
mit einfach kookkurriert, soll im Folgenden zunächst diese Partikel fokussiert 
werden. Tatsächlich gibt es mehrere Übereinstimmungen zwischen den beiden, 
wie sich auch anhand von Tabelle 3 darlegen lässt. 


Tab. 3: Vergleich der Funktionen von Kopfschütteln und einfach 


Kopfschütteln einfach 

pragmatische Wirkung pragmatische Wirkung 

intensivierend intensivierend 

markiert Unsicherheit oder Zweifel markiert einen Sachverhalt als evident, nicht 


hinterfragbar usw. 
markiert Ausnahmslosigkeit markiert Einzigmöglichkeit 


markiert Beurteilungen vielfach in Beurteilungen 


Sowohl dem Kopfschütteln als auch der Partikel einfach ist eine pragmati- 
sche Wirkung zuzuschreiben, die gelegentlich als intensivierend aufgefasst wird 
(siehe aber Abschnitt 7.3.4). Die Begriffe der Ausnahmslosigkeit und der Einzig- 
möglichkeit sind auch weitgehend kompatibel (obwohl sich gelegentlich neben 
einem ausnahmslos zutreffenden Sachverhalt theoretisch noch andere, in der 
Praxis aber nicht vorkommende Möglichkeiten ausdenken ließen), und in den 
beiden Fällen stellen Beurteilungen einen typischen Verwendungsbereich dar. 
Lediglich die Funktion des Kopfschüttelns, Unsicherheit oder Zweifel zu markie- 
ren, scheint auf den ersten Blick kein direktes Pendant bei der Partikel einfach zu 
haben (zwar wurde im Abschnitt 2.3.3 darauf hingewiesen, dass die Partikeln der 
Cluster 2a/b auch in Kontexten der Unsicherheit Anwendung finden, allerdings 
dann eher zur Maskierung als zur Markierung der Unsicherheit). 

Im Hinblick auf diese Übereinstimmungen zwischen dem Kopfschütteln und 
der Partikel einfach ist es nicht verwunderlich, dass die beiden Elemente gele- 
gentlich gemeinsam verwendet werden. Illustrieren lässt sich diese Kookkurrenz 


Kopfschütteln und einfach — 113 


anhand von Beispiel (1). In diesem Auszug aus den Sportberichten redet Sachex- 
perte und ehemaliger Biathlonweltmeister Sven Fischer (SF) über seinen Lands- 
mann Christoph Stephan, der gerade seinen ersten Biathlon-Weltcup-Sieg errun- 
gen hat. In seiner Lobrede verwendet Fischer dreimal die Partikel einfach, und 
dreimal geht damit ein Kopfschütteln einher. Für Fischer steht außer Frage, dass 
dies eine lobenswerte Leistung war, und dass man diese Leistung auf jeden Fall 
(‚ausnahmslos‘) als „klasse“ und „phänomenal“ bezeichnen soll, markiert er 
durch die wiederholte Verwendung der Partikel einfach und des Kopfschüttelns. 

In Abbildung 13 wird der Anfang des dritten Schüttelns (zu Zeile 1195) gezeigt 
(d. h. die erste Rechts-links-rechts-Bewegung). Dieses Schütteln ist, wie generell 
die meisten Belege des abtönenden Kopfschüttelns, eher subtil, d. h. die 
Amplitude ist eher beschränkt. Daher wurde die Abbildung mit weißen Achsen- 
linien versehen, um die Bewegung deutlicher erkennbar zu machen. 


í) FG_A1b 

1188 SF gemÜtszustand ging AUF und ab; 

1189 und äh da bleibt wIrklich kein auge TROcken 

1190 auch bei MIR nich. 

1191 also ich gÖnn=s dem jungen so SEHR, 

1192 > und äh christoph stephan hAt {das einfach 
nur verDIENT und; } 

1193 > {°h einfach KLAS}se. 

1194 mir fällt=s jetzt wirklich SCHWER da 
gefasst zu sein und einfach zu analyslIEren. 

[195 > also wAr (.) {war einfach PHÄnomenal.} 


Abb. 13: Kopfschütteln mit einfach 


7.2.2 Stärke der Korrelation 


Berechtigterweise lässt sich an dieser Stelle die Frage stellen, wie stark die Kor- 
relation von Kopfschütteln und einfach ist. Von den 135 ‚sichtbaren‘ Belegen von 
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einfach in Assertionen“ gehen 32 (= 23,70%) mit einem Kopfschütteln einher. Be- 
schränkt man sich auf diejenigen Fälle, in denen einfach überhaupt mit einer ab- 
tönungsliierten Geste einhergeht, so steigt die Zahl der einfach-Belege mit Kopf- 
schütteln auf genau 50,00% (32 von 64) an. Allerdings ist ein deutlicher 
Unterschied zwischen den Fernsehdaten und den Parlamentsdaten nachzuwei- 
sen: In den Fernsehdaten ist die abtönungsliierte Geste, die mit einfach einher- 
geht, in 58,82% der Fälle (30 von 51) ein Kopfschütteln, während es sich in den 
Parlamentsdaten nur um 15,38% (2 von 13 Belegen) handelt. Allerdings dürfte 
dieser Unterschied zu einem großen Teil mit externen, mit der Sprechsituation zu 
verknüpfenden Faktoren zusammenhängen, die besonders bei den politischen 
Reden der Realisierung des Kopfschüttelns entgegenwirken können (vgl. dazu 
Kapitel 12). Berücksichtigt man die Rolle dieser Faktoren, so lässt sich also 
schlussfolgern, dass die Chance eher hoch ist, dass wenn einfach überhaupt mit 
einer Geste kombiniert wird, diese Geste ein Kopfschütteln ist. 

Damit ist allerdings noch nicht bewiesen worden, dass von einer richtigen 
Korrelation zwischen Kopfschütteln und einfach gesprochen werden kann. Im- 
merhin ist die Geste, die einfach begleitet, nur in ungefähr der Hälfte der Fälle ein 
Kopfschütteln, und in mehr als der Hälfte der Belege von einfach liegt keine ab- 
tönungsliierte Gestik vor. Trotzdem lassen sich Indizien dafür anführen, dass 
doch eine starke Beziehung zwischen Kopfschütteln und einfach nachzuweisen 
ist, u. a. in Fällen wie dem nächsten Beispiel. In diesem Talkshowauszug be- 
schreibt Hera Lind (HL) anhand einiger eingeblendeter Bilder ihren Urlaub in der 
Südseeregion. Während sie erzählt, wie schön sie diese Gegend findet, nickt sie 
fast andauernd. Allerdings gibt es eine Einheit, bei der sie kurz den Kopf schüt- 
telt, und das ist gerade diejenige Einheit, die die Partikel einfach enthält (Einheit 
406). Da sie vor und nach dieser Einheit nickt aber während dieser partikelhalti- 
gen Einheit den Kopf schüttelt, liegt die Vermutung nahe, dass doch eine gewisse 
Verwurzelung der Kombination [einfach+Kopfschütteln] im Sprachgedächtnis 
nachzuweisen sein dürfte. 


(2) FG_B1b 
397 IN das Ist auch im hintergrund SÜDsee? 
398 HL das ist SÜDsee ja, 


399 das müsste mooREa sein oder, 
400 bOra BOra, 

401 taHIti, 

402 IRgendwie so was; 


4 Die Verwendungen von einfach in Aufforderungen und Entscheidungsfragen sind mit insge- 
samt 14 Belegen im Korpus zu selten, um in die Analyse einbezogen zu werden. 
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403 also dA ist es TRAUMhaft schön; 

404 da wAr ich gerade nochMAL, 

405 IN  <<pp>SCHÖN.> 

406 HL > dAs ist {einfach (-) ein TRAUM} ja; 
407 wuNderschön; 


Wenn man den Standpunkt wechselt und von der Geste ausgeht, ist die Kor- 
relation wesentlich schwächer. Insgesamt sind im Korpus 297 Belege des Kopf- 
schüttelns vorhanden, denen eine abtönende Wirkung zugeschrieben werden 
kann. Die 32 Belege mit einfach machen also nur gut ein Zehntel (10,77%) der 
Fälle des abtönenden Schüttelns aus.’ Allerdings untergräbt diese Beobachtung 
die obige Darstellung nicht ganz, denn gelegentlich enthält der verbale Kontext 
ein von der Bedeutung her mit einfach verwandtes Element. Darauf soll im Ab- 
schnitt 7.3 eingegangen werden. 

Zum Schluss sei noch kurz auf die Rolle der Kontextverschiebung eingegan- 
gen. Bei der Vorstellung des Clusters 2b im Abschnitt 2.3.3 wurde bereits ange- 
deutet, dass nicht immer der aktuelle Sprecher für die Abtönung verantwortlich 
ist, und es wurde die Frage formuliert, ob sich das auf die Gestik auswirken 
könnte. Tatsächlich zeichnet sich in den Daten eine deutliche Tendenz ab (ob- 
wohl sich bei lediglich 8 kontextverschobenen Belegen von einfach mit einer 
Geste eine gewisse Zurückhaltung beim Generalisieren empfiehlt): Während bei 
57,41% der nicht-kontextverschobenen Belege von einfach (31 von 54) ein Kopf- 
schütteln realisiert wird, ist das nur in 12,50% der kontextverschobenen Belege 
(1 von 8) der Fall. Diese Tendenz lässt sich auch für andere abtönende Gesten mit 
einfach nachweisen (etwa für das bereits angesprochene Achselzucken, auf das 
im Abschnitt 9.2 noch eingegangen werden soll und das in 12,50% der kontext- 
verschobenen Belege und in 24,07% der nicht-kontextverschobenen Belege ein- 
gesetzt wird). Interessant ist in dieser Hinsicht auch, dass die illokutionstypbe- 
zogenen Gesten (s. Abschnitt 10.2) 62,50% der kontextverschobenen Partikel- 
belege ausmachen (5 von 8), aber nur 11,11% der nicht-kontextverschobenen Be- 
lege (6 von 54). Sprecher scheinen mit anderen Worten mehr abtönende Gesten 
zu realisieren, wenn sie selber für die Abtönung zuständig sind, was sich auch 
auf die Distribution des Kopfschüttelns auswirkt: Vor allem in den nicht-kontext- 
verschobenen Fällen dürfte die Korrelation zwischen einfach und Kopfschütteln 
nicht zu vernachlässigen sein. 


5 In diesem Fall ist die Tendenz etwas stärker in den Parlamentsdaten (2 von 8 Belegen, d.h. 
25,00%, gegen 30 von 289 Belegen oder 10,38% in den Fernsehdaten). Dies dürfte darauf zurück- 
zuführen sein, dass der Kopf in den Parlamentsreden generell weniger oft geschüttelt wird und 
dass das Kopfschütteln daher stärker an verbale Trigger wie einfach gebunden ist. 
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7.2.3 Timing des Kopfschüttelns 


Was das Timing von Gesten betrifft, ist auf McNeills (1992: 26-29) Synchroniere- 
geln hinzuweisen. Diese Regeln besagen, dass eine Geste (bzw. ihr Stroke) typi- 
scherweise mit der hauptbetonten Silbe realisiert wird (‚phonological syn- 
chrony‘), mit dem sogenannten lexikalischen Pendant (‚lexical affiliate‘, d.h. das 
verbale Element mit entsprechender Bedeutung) überlappt (‚semantic syn- 
chrony‘) und die gleiche pragmatische Wirkung hat wie die zugleich produzier- 
ten verbalen Elemente (‚pragmatic synchrony‘). Welche Rolle diese Tendenzen 
bzw. Regeln bei der Kookkurrenz von Kopfschütteln und einfach spielen, ist das 
Thema dieses Abschnitts. 

Zunächst ist darauf hinzuweisen, dass das Kopfschütteln in keinem einzigen 
Beleg nur mit der Partikel einfach überlappt. Dass die Vorbereitungsphase einer 
Geste vielfach dem lexikalischen Pendant vorangeht, um den Stroke mit dem le- 
xikalischen Pendant überlappen zu lassen, wurde in der Literatur bereits ange- 
deutet (u. a. von McNeill 2005: 35), und auch auf die Tatsache, dass die Realisie- 
rung der Geste vielfach länger dauert als das Aussprechen des lexikalischen 
Pendants (insbesondere, wenn es sich wie hier um ein Einzelwort handelt), 
wurde bereits hingewiesen (vgl. Ferr& 2010). Allerdings ist die temporale Diskre- 
panz im Falle des Kopfschüttelns bei einfach vielfach zu groß, um restlos auf 
diese physikalischen Realisierungsbedingungen zurückführbar zu sein. In 18 der 
32 Belege fängt die Geste vor der Partikel an, und nur vier Schüttelbelege (die alle 
vor der Partikel anfangen) werden nach dem Äußern der Partikel nicht weiterge- 
führt, während 20 Schüttelbelege bis zum Ende der Intonationseinheit andauern 
(allerdings gelegentlich mit abnehmender Amplitude). In sieben Fällen über- 
lappt das Schütteln gar mit der ganzen Intonationseinheit. 

Die Vermutung liegt nahe, dass die Zeitdauer der Geste auf den Skopus zu- 
rückzuführen ist. Wie im zweiten Kapitel bereits erwähnt wurde, haben Modal- 
partikeln im Allgemeinen Skopus über die ganze Äußerungseinheit, in der sie 
eingesetzt werden. Infolge der Übereinstimmung auf Bedeutungsebene wäre zu 
erwarten, dass dies auch für abtönende Gesten gilt. Ein wichtiger Unterschied 
zwischen der verbalen Partikel und der Geste besteht darin, dass die Partikel ein 
kurzes Element ist, das nicht angehalten werden kann, während der Rest der Äu- 
Berung ausgesprochen wird. Die Geste dagegen unterliegt dieser Einschränkung 
nicht: Sie kann auch weitergeführt werden, während der Rest der verbalen Äuße- 
rung realisiert wird, und sogar das Realisieren einer anderen Geste muss nicht 
unbedingt zum Anhalten des Kopfschüttelns führen (sofern es physiologisch 
möglich ist, die beiden Gesten zugleich zu produzieren). Dass die Dauer einer 
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Geste ihren Skopus andeuten kann, hat Harrison (2010) bereits dargelegt.° Zudem 
ist aus der Gebärdensprachenforschung bekannt, dass sich der Skopus der soge- 
nannten nonmanuellen Mittel (darunter auch Kopfbewegungen), die u. a. in der 
Deutschen Gebärdensprache zu Abtönungszwecken eingesetzt werden (s. Herr- 
mann 2005), über diejenigen manuellen Zeichen erstreckt, mit denen sie zeitlich 
überlappen (vgl. auch Zeshan 2004: 32). Das Gleiche scheint auf das Kopfschüt- 
teln mit einfach zuzutreffen: Es erstreckt sich über die Intonationseinheit, weil es 
Skopus über sie hat. 

Auf den ersten Blick dürfte gegen diese Verknüpfung von Dauer und Skopus 
sprechen, dass sich die Geste nicht immer über die ganze Intonationseinheit er- 
streckt, obwohl damit keine Beschränkung des Skopus einherzugehen scheint. 
Allerdings muss dies m. E. nicht unbedingt problematisch sein: Ähnlich wie die 
verbale Partikel hat das Kopfschütteln Skopus über die ganze Intonations- bzw. 
Äußerungseinheit, was erklärt, wieso es mit dieser ganzen Einheit überlappen 
kann, aber ebenfalls ähnlich wie die Partikel kann das Schütteln auch eine kür- 
zere Dauer aufweisen und trotzdem diesen breiten Skopus haben. Interessant ist 
in dieser Hinsicht auch die Beobachtung, dass in nur sieben Belegen die phono- 
logische Synchronieregel nicht erfüllt ist. Die Geste überlappt also in 25 von 32 
Fällen mit dem hauptbetonten verbalen Element (meist dem Hauptverb), d. h. mit 
dem anscheinend wichtigsten Element im Skopus der Partikel. 

Die Partikel selber wird in 28 der 32 Belege während der Schüttelgeste reali- 
siert (wie es aufgrund der semantischen Synchronieregel zu erwarten wäre). In 
zwei der vier Ausnahmefälle wird die Geste kurz nach der Partikel eingesetzt und 
überlappt mit dem Hauptton, sodass in diesen Fällen zumindest die phonologi- 
sche Synchronieregel erfüllt ist. In den beiden anderen Fällen wird die Geste 
nicht während der verbalen Äußerung produziert, sondern während einer kurzen 
Pause, die der Äußerung direkt vorangeht. In diesen Fällen scheint die Geste als 
eine Art Projektorform in der linken Peripherie der Äußerung aufzutreten, indem 
sie die nachfolgende Äußerung ‚projiziert‘ oder ‚ankündigt‘.” Eben durch diese 


6 Konkret hat Harrison für negierende Handgesten im Englischen gezeigt, dass der Stroke mit 
dem lexikalischen Partner (d. h. der verbalen Negation) zusammenfällt und dass der Hold mit 
den verbalen Elementen überlappt, die sich im Skopus der Negation befinden. Oben wurde be- 
reits angedeutet, dass es bei Gesten wie dem Kopfschütteln schwieriger ist, einen Stroke und 
einen Hold zu unterscheiden, aber trotzdem dürfte auch in diesem Fall die Dauer der Geste ein 
Indiz ihres Skopus sein. Vgl. für eine ähnliche Bemerkung zur Dauer von Gesten auch Streeck 
(2007: 161). 

7 Durch das Auftreten in einer Pause vor einer Äußerung weist das Kopfschütteln in diesen Fäl- 
len eine gewisse Ähnlichkeit zu Verzögerungsphänomenen wie verbalem ähm auf (vgl. dazu Ab- 
schnitt 7.3.3). Zum Phänomen der Projektion vgl. u. a. Günthner (2008). 
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Projektion erstreckt sich zugleich ihr Skopus dann auch über die Äußerung, die 
von ihr projiziert wird. 

Zusammenfassend ließe sich also festhalten, dass in den meisten Fällen zu- 
mindest eine von McNeills Synchronieregeln erfüllt ist, indem sich die Geste mit 
dem Hauptton und/oder der verbalen Partikel überlappt. Dass die beiden zu- 
gleich erfüllt sein können, während die Partikel im Prinzip nicht (und in meinen 
Daten nie) hauptbetont ist, ist auf die Dauer der Geste zurückzuführen, die ihrer- 
seits vielfach den Skopus der Geste widerspiegelt. 


7.3 Andere Verwendungskontexte des Kopfschüttelns 


Oben wurde bereits darauf hingewiesen, dass die mit einfach kombinierten Be- 
lege nur einen relativ kleinen Teil der Belege des abtönenden Kopfschüttelns aus- 
machen. Deshalb soll jetzt auf einige weitere Verwendungsbereiche des Kopf- 
schüttelns eingegangen werden, darunter auch die Verwendung in Kombination 
mit anderen Elementen des Clusters 2b. Zwei Fragen ziehen sich wie ein roter Fa- 
den durch diese Diskussion: Inwiefern weist das Kopfschütteln in diesen Berei- 
chen den gleichen Bedeutungsfächer auf wie in Kombination mit einfach, und 
was sagt dies aus über die anderen Elemente, mit denen es vorkommt, sowie über 
deren Beziehung zur Partikel einfach? 

Die Analyse erfolgt in vier Schritten. Zunächst (7.3.1) wird auf die Verwen- 
dung des Kopfschüttelns mit anderen Modalpartikeln (und insbesondere mit den 
anderen Partikeln des Clusters 2b) eingegangen. Danach wird die Kookkurrenz 
mit anderen verbalen Elementen, die sich mit Cluster 2b verknüpfen lassen, be- 
sprochen (7.3.2), und anschließend wird die Verwendung des Kopfschüttelns 
ohne expliziertes lexikalisches Pendant zum Thema (7.3.3). Zum Schluss wird 
noch kurz auf die Frage eingegangen, inwiefern es sich beim Kopfschütteln um 
einen Intensivierer handeln dürfte (vgl. oben), indem die Kookkurrenz mit eini- 
gen typischen verbalen Intensivierern besprochen wird (7.3.4). 


7.3.1 Kopfschütteln mit anderen Modalpartikeln 


Für die Besprechung der Verwendung des Kopfschüttelns mit anderen Modalpar- 
tikeln erscheint es sinnvoll, zunächst auf die beiden anderen zentralen Elemente 
des Clusters 2b einzugehen: die Partikeln eben und halt. Im Abschnitt 2.3.3 wurde 
bereits darauf hingewiesen, dass bislang kein Einverständnis darüber besteht, 
wie sich die Partikeln dieses Clusters genau zueinander verhalten. Im Rahmen 
einer Kookkurrenzanalyse von Modalpartikeln und Gestik liegt es auf der Hand, 
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dass auch die Frage gestellt wird, wie diese Diskussion im Lichte der Gestikana- 
lyse zu interpretieren ist. 

Das Kopfschütteln wirft auf jeden Fall ein neues Licht auf das Verhältnis von 
eben, einfach und halt. Ist es bei einfach die häufigste abtönende Geste, so ist es 
bei eben gar nicht belegt. Belege von halt mit Kopfschütteln lassen sich finden 
(3), sind aber deutlich seltener als Belege von einfach mit Kopfschütteln (die ge- 
nauen Zahlen sind Tabelle 4 zu entnehmen; da das Kopfschütteln in den Fern- 
sehdaten wesentlich häufiger vorkommt als in den Parlamentsdaten, enthält die 
Tabelle neben Angaben zur ganzen Datensammlung auch - eingeklammert - die 
spezifischen Zahlen für die Fernsehdaten). 


3) FG_Bla 
1089 MK und als unsere tOchter dann AUSgezogen ist- 
1090 und unser hUnd geSTORben ist- 
1091 hAben wir gesagt SO, 
1092 jetzt nehmen wir uns eine schöne WOHnung, 
1093 und °h können ABschließen 
1094 auch mal in URlaub fahren und so; 
1095 > was man im Alter {halt so TUT, } 


Tab. 4: Kopfschütteln bei den zentralen Partikeln des Clusters 2b 


einfach halt eben 

23,70% 4,62% 0,00% der sichtbaren Partikelbelege 

(25,42%) (5,45%) (0,00%) 

51,61% 12,50% 0,00% der sichtbaren Partikelbelege mit einer Geste 


(61,22%) (15,79%) (0,00%) 


Aufgrund dieser Distribution des Kopfschüttelns liegt die Vermutung nahe, 
dass auch auf Bedeutungsebene ein Kontinuum eben - halt - einfach angenom- 
men werden kann. Die Distribution der anderen abtönenden Gesten (vgl. dazu 
die beiden nächsten Kapitel) suggeriert, dass dies eine leichte Vereinfachung ist, 
aber aufjeden Fall ist bei allen Gesten ein deutlicher Unterschied in der Frequenz 
zwischen eben und halt wahrnehmbar, was als Indiz dafür zu sehen ist, dass 


8 Mangelschots/Schoonjans (2017) zeigen allerdings, dass diese Kombination nicht ganz aus- 
geschlossen ist, aber auch in ihren Daten ist das Kopfschütteln bei eben wesentlich seltener als 
bei einfach. 
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diese Partikeln - contra u. a. Autenrieth (2002) - nicht als Synonyme zu betrach- 
ten sind. Wertvoller scheint in dieser Hinsicht Thurmairs bereits im Abschnitt 
2.3.3 angesprochener Ansatz zu sein. Thurmair zufolge markiere einfach spre- 
cherbezogene Evidenz, während halt hörerbezogene Plausibilität und eben hö- 
rerbezogene Evidenz andeute. Einfach weise mit anderen Worten einen stärkeren 
Sprecherbezug auf als die beiden anderen Partikeln, bei denen eben noch kate- 
gorischer wirke als halt. Dass eine Geste wie das Kopfschütteln, die typisch ist für 
einfach, auch mit halt belegt ist aber nicht mit eben, könnte sich dann dadurch 
erklären lassen, dass sprecherbezogene Evidenz (einfach) an sich weniger kate- 
gorisch wirkt als objektiv für alle Gesprächsteilnehmer feststehende Evidenz 
(eben), was die Nähe zum ebenfalls weniger kategorischen halt erklären könnte 
(ausführlicher dazu: Schoonjans [i. E.]). 

Bei den anderen in der vorliegenden Arbeit analysierten Partikeln spielt das 
Kopfschütteln keine große Rolle. Es sind einige Einzelbelege mit ja nachzuweisen 
(insgesamt 12 der 475 Belege von ja), bei denen die Geste eine ähnliche Evidenz- 
markierung hat wie bei einfach (4). In diesem Fall ist also die gestische Abtönung 
stärker als die verbale: Durch die Partikel ja markiert die Sprecherin (HL), dass 
sie davon ausgeht, dass dem Hörer (IN) der angesprochene Sachverhalt (die Tat- 
sache, dass die Oper drei Stunden dauert) bekannt sein dürfte oder dass er dieser 
Aussage zumindest nicht widersprechen werde; dass dieser Sachverhalt ihrer 
Meinung nach tatsächlich evident ist und nicht zur Diskussion steht, wird ledig- 
lich auf gestischer Ebene durch das Kopfschütteln markiert. 


(4) FG_B1b 
791 IN und wAs wird geSUngen, 
792 HL eine HÄndel (.) Oper, 
793 und die lern ich auswendig mit em Ipod beim 


JOGgen; 
794 IN ah SIEH; 
795 HL JA. 


796 IN [aber (-) ( ) 
797 HL > [also (.) {die dAUert ja drei STUNden, } 
798 und (--) der CHOR ist da sehr präsEnt- 


1799 IN <<pp>JA:.> 
800 HL also da FREU ich mich riesig drAUf. 


Des Weiteren liegt jeweils ein Beleg des Kopfschüttelns bei denn und eigent- 
lich vor (in beiden Fällen in einer Ergänzungsfrage). In diesen Fällen dürfte es 
sich ebenfalls um eine Art implizierte oder grammatikalisierte Negation handeln, 
die aber im Rahmen der interrogativen Illokution nicht als Evidenzmarkierer zu 
interpretieren ist. Vielmehr handelt es sich um eine Andeutung der Tatsache, 
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dass dem Sprecher die Antwort nicht bekannt ist. Dies ist bei Fragen typischer- 
weise der Fall, wird aber durch das Kopfschütteln noch zusätzlich markiert, was 
auch implizieren kann, dass der Sprecher gar keine Ahnung hat, was die Antwort 
auf seine Frage ist. Das Nicht-Wissen der Antwort erklärt also die Verwendung 
des Kopfschüttelns, wie im nachstehenden Beispiel (5), in dem von der Arbeit in 
einem Kinderhospiz die Rede ist. Mit der eigentlich-Frage wechselt der Sprecher 
(RB) von den Arbeitsverhältnissen (einschließlich der ehrenamtlichen Natur der 
Arbeit) zur Finanzierungsfrage. Hier liegt also eine Arbeitsverteilung zwischen 
den Ausdrucksebenen vor: Durch die Partikel eigentlich wird der Themenwechsel 
hervorgehoben, durch das Kopfschütteln dagegen der Umstand, dass der Spre- 
cher die Antwort nicht kennt. Infolge der Seltenheit des Kopfschüttelns bei denn 
und eigentlich im Korpus soll aber an dieser Stelle nicht weiter auf diese Verwen- 
dung der Geste eingegangen werden. 


(5) FG_B2a 
2023 RB sie mAchen das Ehrenamtlich, 
2024 UB JA. 
2025 RB > ähm (.) {wie finanZlIEren sie sich 
eigentlich; } 


7.3.2 Kopfschütteln mit weiteren lexikalischen Elementen 


In der Diskussion zur Abgrenzung der Modalpartikelkategorie ist einige Male da- 
rauf hingewiesen worden, dass Modalpartikeln nicht die einzigen Elemente sind, 
die zu Abtönungszwecken eingesetzt werden können. Dies gilt auch für den in 
diesem Kapitel zentralen Cluster 2b. Tatsächlich können Bedeutungen wie Evi- 
denz, Plausibilität und Unabänderlichkeit auch durch andere Lexeme zum Aus- 
druck gebracht werden, insbesondere Adverbien wie echt, wirklich, richtig, natür- 
lich, selbstverständlich usw. Auch für diese Elemente kann die Gestikanalyse ein 
neues Licht auf die Frage der genauen Beziehung zu Partikeln wie einfach werfen. 

Als Stichprobe wurde nachgeschaut, ob die drei im Korpus am häufigsten 
verwendeten Elemente der obigen Liste (echt, wirklich und natürlich) mit einem 
Kopfschütteln einhergehen können. Tatsächlich lassen sich einzelne Belege mit 
diesen Elementen vorfinden. In Beispiel (6) erzählt Thekla Carola Wied (TW) dar- 
über, wie sich ihr Ehemann und sie nach gut 15 Jahren Ehe immer noch häufig 
kleine Liebesbriefchen schreiben, und in (7) berichtet Hera Lind (HL) über eine 
Segelschifffahrt um die Welt, die sie mit ihrer Familie unternommen hat, und wie 
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sie dabei selber ihre Töchter unterrichtet hat. Die Elemente natürlich (6) und wirk- 
lich (7) in diesen Beispielen gehen mit einem abtönenden Kopfschütteln einher, 
wie es für einfach beschrieben wurde. 


(6) FG_B2a 

1131 TW und dann sind=s krieg ich IMmer ein ein 
brIEfchen mit von meinem mann; 

1132 wenn ich WEGfliege, 

1133 hab ich immer so ein schönes (--) brIEfchen 
für die REIse und, 

1134 [und 

1135 RB [das stEckt er dann nochmal geHEIM in die 
tAsche; 

1136 TW das stEckt er geheim in die TAsche, 

1137 und also äh es äh (-) wir sInd da sehr 
erFINdungsreich, 

1138 RB <<pp>JA.> 

1139 TW > das {(.) mUss natürlich SEIN; } 

1140 RB <<p>JA-> 

1141 TW sonst w äh s wär s LANGweilig. 


(7) FG_B1b 
536 HL wir waren sEhr diszipliNIERT. 
537 es gIbt ja viele SEEtage; 
538 IN mhm 
539 HL zum beispiel zwischen hawAii °h und der 
südsee ist man SECHS tage auf see. 
540 > und (.) {da wUrde wirklich} geLERNT, 
541 INtensiv; 


Da es sich nur um eine Stichprobe handelt, bleibt weiterhin zu erforschen, 
wie systematisch das Kopfschütteln mit diesen Adverbien verwendet wird. Dass 
die Geste aber auch in diesen Fällen eingesetzt werden kann, soll an sich nicht 
wundern, da sich auf Bedeutungsebene eine deutliche Beziehung zur Modalpar- 
tikel einfach nachweisen lässt: Es handelt sich um Elemente, die die Wahrheit des 
Sachverhalts implizieren, allerdings stärker sind als der reine Wahrheitsmarkie- 
rer ja (besonders im Fall von natürlich liegt es nahe, von Evidenz zu sprechen, 
also gerade einer der Kernbedeutungen des Clusters 2b). Zudem kann diesen Ele- 
menten, insbesondere echt und wirklich, eine gewisse intensivierende Wirkung 
zugeschrieben werden, die ähnlich wie bei einfach (vgl. Abschnitt 2.3.3) darauf 
zurückzuführen sein dürfte, dass sie den Sachverhalt als mehr-als-nur-wahr mar- 
kieren (vgl. aber zur Intensivierung Abschnitt 7.3.4). Allerdings können diese Ele- 
mente auch mit einem abtönenden Nicken kombiniert werden (vgl. dazu Ab- 
schnitt 7.4). 
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7.3.3 Kopfschütteln ohne lexikalisches Pendant 


Bislang wurde das Kopfschütteln nur in Kombination mit einem lexikalischen 
Pendant besprochen. Damit ist allerdings nicht bewiesen, dass das Kopfschütteln 
selber eine abtönende Bedeutung vermittelt, die als Grund für die Kookkurrenz 
mit dem jeweiligen verbalen Ausdruck anzuführen ist. Um zu zeigen, dass das 
Kopfschütteln tatsächlich als eine abtönende Geste zu betrachten ist, soll diese 
abtönende Bedeutung auch in Kontexten nachgewiesen werden, in denen kein 
lexikalisches Pendant vorhanden ist, das sie zum Ausdruck bringt. 

Es stellt sich heraus, dass eine Einstufung des Kopfschüttelns als abtönend 
durchaus gerechtfertigt ist. Tatsächlich lassen sich im Korpus nicht weniger als 
245 partikellose Äußerungen vorfinden, in denen nur durch das Kopfschütteln 
eine mit Cluster 2b zu verknüpfende Bedeutung (Evidenz, Unabänderlichkeit 
o. dgl.) zum Ausdruck gebracht wird. Die Partikelbedeutung ist also anwesend, 
während die verbale Partikel selber fehlt. 

Illustrieren lässt sich diese Situation anhand der Beispiele (8-9). In Auszug 
(8) berichtet Ute Büschl (UB) darüber, wie im Kindergarten ihrer beiden Söhne 
mit dem Tod der neugeborenen Schwester umgegangen wurde. Einheit 2189 wird 
durch das Kopfschütteln als auf der Hand liegend markiert: Es ist ganz normal 
und logisch, dass sie darüber sprechen. Aus dem Kontext geht hervor, dass viel- 
leicht nicht alle dies so leicht finden, aber UB und die beiden Söhne sehen keinen 
Grund, nicht darüber zu sprechen. Es steht mit anderen Worten für sie nicht zur 
Diskussion, dass man das tut. Ähnlich ist die Situation in Auszug (9), in dem Hera 
Lind (HL) über die Thematik ihres Buches Herzgesteuert spricht. Sie verteidigt die 
Liebe als Romanthema, denn ihrer Meinung nach („ich glaub“) ist die Liebe „das 
Höchste“, was es gibt bzw. „was ein Menschenleben sinnvoll macht“. Durch ich 
glaube gibt sie zwar an, dass es sich bei dieser Einstufung der Liebe als „das 
Höchste“ um ihre eigene Ansicht handelt, markiert aber zugleich diese Einstu- 
fung durch das Kopfschütteln als aus ihrer Sicht nicht zur Diskussion stehend: 
Ihrer Meinung nach ist die Liebe einfach das Höchste; darüber braucht man sich 
nicht zu streiten. In den beiden Fällen fehlt eine verbale Partikel; die Evidenzbe- 
deutung (logisch bzw. auf der Hand liegend in (8), der Sprecherin zufolge nicht 
zur Diskussion stehend in (9)) wird lediglich gestisch zum Ausdruck gebracht. 


(8) FG_B2a 
2187 UB es war (.) wi sie durften Immer darüber 
SPREchen, 
2188 und dAs find ich WICHtig; 
2189 > und {dAs tun sie auch HEUte noch, 
2190 dass} sie Irgendwie (.) kindern die sie neu 


kennen lernen erZÄHlen, 
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2191 jaja; 
2192 wir wAren mal zu DRITT, 
2193 wir hatten noch ne schwEster aber die ist 
geSTORben; 
(9) FG_Bib 


851 HL äh s ne liebesgeschichte ist ja Immer (.) 


eigentlich das SCHÖNSste; 
852 jeder mensch WÜNSCHT sich (.) lIEbe- 
853 und gellEbt zu WERden-= 
854 =und sElbst zu LIEben- 
855 > und ich glAUb {das ist das HÖCHste}, 
856 was ein mEnschenleben SINNvoll macht- 


Das Kopfschütteln fügt in diesen Fällen also die Nuance hinzu, die es auch 
in Kombination mit Elementen wie einfach vermittelt. Die Evidenzbedeutung des 
Kopfschüttelns wird also nicht ausgehend von der Bedeutung von einfach in die 
Geste hineininterpretiert. Vielmehr drückt die Geste selber (auch) die Bedeutung 
aus, was ihre häufige Kookkurrenz mit der auf Bedeutungsebene durchaus ähn- 
lichen Partikel einfach (und weiteren Elementen dieses semantisch-pragmati- 
schen Feldes) mit erklärt. 

An sich ist die Beobachtung, dass das Kopfschütteln selber abtönend wirkt, 
nicht allzu verwunderlich, denn auch in der Deutschen Gebärdensprache (DGS) 
wird das Kopfschütteln als Abtönungsmittel eingesetzt. Insbesondere hat Herr- 
mann (2013: 130) darauf hingewiesen, dass „small and slow headshakes“ in DGS 
als Markierer der Evidenz eingesetzt werden können. Wirklich „slow“ scheint das 
Kopfschütteln als abtönende Geste im gesprochenen Deutschen zwar nicht zu 
sein, aber im Allgemeinen handelt es sich tatsächlich um eine subtile („small“) 
Geste. Hier lässt sich also eine gewisse Übereinstimmung zwischen Deutsch und 
DGS nachweisen, die allerdings noch weiterer Erforschung bedarf. 

Zum Schluss sei noch auf eine bestimmte Verwendung des Kopfschüttelns 
ohne lexikalisches Pendant hingewiesen. Es wird nämlich auch eingesetzt, wäh- 
rend der Sprecher das richtige Wort bzw. eine passende Formulierung sucht. In 
diesem Kontext erscheint das Kopfschütteln meist während einer kurzen Sprech- 
pause, die fällt, wenn der Sprecher nach dem passenden Ausdruck sucht, und 
die Geste kann weitergeführt werden, während der gesuchte Ausdruck im Endef- 
fekt ausgesprochen wird. 

Auf den ersten Blick dürfte die Beziehung dieses Kopfschüttelns in der Wort- 
suche zu den vorigen Beispielen als etwas künstlich erscheinen, und man könnte 
sich fragen, ob die Geste nicht einfach andeutet, dass der Sprecher das richtige 
Wort sucht (und dementsprechend mit verbalen Verzögerungssignalen wie ähm 
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zu vergleichen wäre?). In dem Fall wäre die implizierte Negation zu interpretieren 
als ‚ich weiß nicht, wie ich es sagen soll‘. Allerdings ist besonders in Fällen wie 
(9), in denen die Geste während des Äußerns des gesuchten Ausdrucks weiterge- 
führt wird, auch eine Beziehung zur Abtönung anzunehmen. Demnach wäre in 
diesem Fall die Bedeutung des Kopfschüttelns zu umschreiben als ‚ich muss es 
einfach so sagen‘, ‚ich weiß nicht, wie ich es anders formulieren soll‘ oder ‚ein 
besserer Ausdruck fällt mir im Moment nicht ein‘. Diese Umschreibungen erin- 
nern an die Paraphrasen, die oben in Bezug auf die Übereinstimmung zwischen 
Kopfschütteln und einfach angeführt wurden, und insbesondere an die Anmer- 
kung, dass Partikeln wie einfach eingesetzt werden können, um Unsicherheit zu 
maskieren, was gerade bei Formulierungsschwierigkeiten häufiger vorkommt. 
Ähnlich hat Spreckels (2009: 140) darauf hingewiesen, dass die Partikel einfach 
ein Indiz kommunikativer Schwierigkeiten sein kann, und diese Kategorie kom- 
munikativer Schwierigkeiten umfasst die Suche nach einer passenden Formulie- 
rung. Es lässt sich also durchaus eine Beziehung zwischen dem ‚Wortsuchekopf- 
schütteln‘ und der Partikel einfach bzw. den oben angesprochenen Beispielen des 
abtönenden Kopfschüttelns nachweisen. 


(10) FG_B2a 

2300 UB man hat die CHANCE (.) bei nUll anzufangen, 

2301 jEder kann machen was er damit WILL, 

2302 ich bin en gAnz anderen weg gegangen der 
mir einfach GUT tut, 

2303 > ja und {(.) ähm (---) so (.) bedIngungslose 
LIEbe; (--)} 

2304 das ist einfach auch so ne (-) sAche dass 


man auch jemand ANnehmen kann, 


Trotzdem ist die Frage, ob das ‚Wortsuchekopfschütteln‘ mit den obigen Bei- 
spielen auf einer Stufe steht, nicht ganz unberechtigt. Tatsächlich betrifft die Ab- 
tönung hier eher eine Metaebene: Nicht der Inhalt der Äußerung wird als evident 
oder einzigmöglich markiert, sondern deren Form bzw. die Formulierung. Dies 
dürfte allerdings für die Partikel einfach bei Formulierungsschwierigkeiten 
gleichermaßen gelten, sodass die Beziehung der Geste zur Partikel nicht von die- 
ser Frage betroffen ist. Festzuhalten bleibt aber vor allem, dass das Kopfschütteln 
auch in diesem Fall eine Art Evidenzbedeutung vermittelt, wenn auch auf einer 
Metaebene (die Einzigmöglichkeit der Formulierung bzw. das Fehlen alternativer 
Formulierungsweisen). 


9 In der betroffenen Einheit in Beispiel (10) wird übrigens auch ein ähm geäußert. 
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7.3.4 Kopfschütteln mit Intensivierern 


Am Ende dieser Übersicht der Verwendungskontexte des abtönenden Kopfschüt- 
telns sei noch auf die schon mehrfach angesprochene Frage der Intensivierung 
zurückgekommen. Im Abschnitt 7.1 wurde bereits darauf hingewiesen, dass dem 
Kopfschütteln gelegentlich auch eine intensivierende Wirkung zugeschrieben 
wird, und im Abschnitt 2.3.3 wurde die Diskussion angesprochen, ob einfach 
nicht eher als Steigerungspartikel denn als Modalpartikel einzustufen sei. Aller- 
dings wurde im Abschnitt 2.3.3 auch die Frage geäußert, ob diese Intensivierung 
nicht als eine Folge der abtönenden Bedeutung zu interpretieren ist: Wenn man 
etwas als evident oder gänzlich außer Streit gestellt markiert - sei es mit der Par- 
tikel einfach oder mit anderen Mitteln -, so wirkt die Aussage fast per definitio- 
nem stärker, als wenn man diese Markierung nicht hinzugefügt hätte. 

Um der Frage nachzugehen, inwiefern es sich beim Kopfschütteln um einen 
Intensivierer handelt, wurde überprüft, wie oft es mit zwei typischen verbalen 
Intensivierungsformen kookkurriert: sehr und ganz. Diese beiden Elemente sind 
im Korpus 158 und 167 Mal (mit sichtbarem Sprecher) belegt, und die Anzahl der 
Belege, die mit einem Kopfschütteln einhergehen, ist eher beschränkt: 19 (= 
11,38%) bei ganz, 4 (= 2,53%) bei sehr. Die Kookkurrenzraten liegen also erheblich 
niedriger als bei einfach. Aufgrund dieser niedrigen Frequenz des Kopfschüttelns 
bei ganz und sehr liegt die Vermutung nahe, dass das Kopfschütteln nicht als rei- 
ner Intensivierer zu betrachten ist, und die Stärke der Korrelation zwischen Kopf- 
schütteln und einfach lässt also vermuten, dass auch die Modalpartikel mehr ist 
als ein reiner Intensivierer. 

Allerdings sei auch hinzugefügt, dass es bei ganz und sehr nicht wie bei ein- 
fach eine Geste gibt, die deutlich häufiger vorkommt als andere. Andere Gesten, 
die mit vergleichbarer Häufigkeit vorkommen, sind Nicken (10 Belege bei ganz = 
5,99%; 22 Belege bei sehr = 13,92%) und Beats (11 Belege bei ganz = 6,59%; 24 
Belege bei sehr = 15,19%). Dass Beats mit verbalen Intensivierern kookkurieren 
können, soll an sich nicht allzu sehr wundern, da die hervorhebende Wirkung 
von Taktstockgesten auch als eine Art Intensivierung zu sehen ist (vgl. Abschnitt 
9.1). Eine ähnliche Beziehung wie für das Kopfschütteln lässt sich für das Nicken 
nachweisen; darauf soll im nächsten Abschnitt ausführlicher eingegangen wer- 
den. 

Es lässt sich mit anderen Worten nicht eine bestimmte Geste nachweisen, die 
bei den Intensivierern deutlich häufiger vorkäme als die anderen und als direktes 
gestisches Pendant eines verbalen Intensivierers betrachtet werden könnte. Auf- 
fällig ist aber, dass den drei mit Intensivierern am häufigsten eingesetzten Gesten 
in der vorliegenden Arbeit eine abtönende Wirkung zugeschrieben wird, und 
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zwar handelt es sich in den drei Fällen um Gesten, mit denen der Sprecher zu 
verstehen gibt, dass er zum Zutreffen des betroffenen Sachverhalts steht (mit Nu- 
ancen der Wahrheit, Evidenz, Prominenz u. dgl.). Die Vermutung liegt nahe, dass 
das Auftreten dieser Gesten mit Intensivierern gerade auf diese Bedeutung zu- 
rückzuführen ist: Wenn man explizit angibt, dass man zur Gültigkeit seiner Aus- 
sage steht, wirkt diese kategorischer, als wenn man das nicht macht. Es bleibt mit 
anderen Worten die Hypothese aufrecht, dass es sich bei den betroffenen Gesten 
nicht um reine Intensivierer handelt, sondern vielmehr um Gesten, die durch ihre 
abtönende Bedeutung auch eine intensivierende Wirkung erzielen können. 


7.4 Exkurs: Nicken 


Im Rahmen dieser Analyse des Kopfschüttelns scheint es sinnvoll, auch kurz ei- 
nen Blick auf das senkrechte Gegenstück dieser Geste (das Nicken) zu werfen. 
Tatsächlich sind Übereinstimmungen zwischen den beiden Gesten nachzuwei- 
sen. In einem ersten Schritt (7.4.1) wird die Verwendung des Nickens mit der Par- 
tikel ja unter die Lupe genommen; anschließend (7.4.2) werden die weiteren Ver- 
wendungskontexte des Nickens angesprochen. 


7.4.1 Nicken und ja 


In westeuropäischen Kulturen ist das Nicken an erster Stelle als die emblemati- 
sche Geste der Bestätigung bzw. Bejahung bekannt. Allerdings scheint es, ähn- 
lich wie das Kopfschütteln, auch abtönende Wirkungen entwickelt zu haben, und 
zwar in dem Sinne, dass es sich genauso wie die verbale Partikel ja zu einer Art 
Wahrheitsmarkierer entwickelt.” Dementsprechend ist es auch nicht verwunder- 
lich, dass gerade ja die Partikel ist, die am häufigsten mit einem Nicken einher- 
geht." 

Ein Beispiel für diese Verwendung findet sich in (11), einem Auszug aus ei- 
nem Gespräch zwischen Fernsehmoderator Reinhold Beckmann (RB) und Schau- 
spielerin Thekla Carola Wied (TW). Wied gibt zu verstehen, dass sie die Verwen- 
dung des Wortes patent in Bezug auf ihre Rollen nicht mag, obwohl es hier „im 


10 Diese abtönende Wirkung des Nickens ist aber noch nicht so eingehend studiert worden wie 
das abtönende Kopfschütteln. 

11 Daneben liegen auch Belege von Nicken mit doch, eben, einfach, halt und Adverbien wie na- 
türlich und echt vor. 
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kritischen Sinne“ gemeint ist. Dass dem so ist, darüber sind sich die beiden ihrer 
Meinung nach wohl einig, wie sie durch die Verwendung der Partikel ja sowie 
des begleitenden Nickens zum Ausdruck bringt. 


(11) FG_B2a 

1265 RB also ich wEIß dass diese rolle WAHNsinnig 
prägend war, 

1266 und natürlich auch in dieser paTENTheit in 
dieser perfektion [einige leute genErvt 
hat; 

1267 TW [dAs WORT nicht 

1268 DAS wort [( jix 

1269 RB [ja paTENT? 

1270 TW p[aTENT. 

1271 RB [allerGIE ja, 

1272 TW hAben sie 

1273 paTENT (.) allerglIE. 

1274 RB ja. 

1275 TW > aber ich meine s (.) wir {sAgen=s ja jetzt 
im kritischen: (-) SINne.} 


Im Korpus liegen 23 Belege der Kombination von ja und Nicken vor. Das ist 
weniger als im Falle von einfach mit Kopfschütteln, was insofern auffällig ist, als 
sowohl der verbale als auch der gestische Teil der Kombination einfach+Kopf- 
schütteln an sich seltener sind als jene der Kombination ja+Nicken (vgl. Tabelle 
5): Insgesamt enthält das Korpus 394 Belege der Nickgeste (gegen 297 Schüttel- 
belege), von denen also 5,84% mit der Partikel ja einhergehen (gegen 10,77% bei 
einfach+Schütteln), und 475 ‚sichtbare‘ Belege von ja (gegen 135 von einfach), 
von denen also 4,84% mit einem Nicken kombiniert werden (gegen 23,70% bei 
einfach+Schütteln). Auch wenn man sich auf diejenigen Fälle beschränkt, in de- 
nen die Partikel überhaupt mit einer abtönungsliierten Geste kombiniert wird, ist 
der Unterschied beachtlich: In 12,92% der Belege von ja mit einer Geste ist die 
Geste ein Nicken, gegen 51,61% in der Kombination einfach+Schütteln. Die Kor- 
relation zwischen der Partikel ja und dem Nicken ist also deutlich weniger stark 
als jene zwischen der Partikel einfach und dem Kopfschütteln. Da erstere Kombi- 
nation in den Daten außerdem seltener ist, soll an dieser Stelle nicht so ausführ- 
lich darauf eingegangen werden, wie das oben für die Kombination ein- 
fach+Kopfschütteln der Fall war. 
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Tab. 5: Vergleich der Kombinationen einfach+Kopfschütteln und ja+Nicken 


einfach + Kopfschütteln ja + Nicken 
Kombinationsbelege 32 23 
Belege der Geste 297 394 
-> davon Kombinationsbelege 10,77% 5,84% 
Partikelbelege 135 475 
Partikelbelege mit Geste 64 178 
-> davon Kombinationsbelege 50,00% 12,92% 


Immerhin gibt es einige Übereinstimmungen zwischen den beiden Kombina- 
tionen. Zum Beispiel ist das Nicken, ähnlich wie das Kopfschütteln, in den Fern- 
sehdaten häufiger belegt als in den Parlamentsdaten: Von den 394 Nickbelegen 
entstammen nur 27 (= 6,85%) den Parlamentsdaten. Dementsprechend ist auch 
die Kombination mit ja in diesen Daten erheblich seltener: Nur ein einziger Beleg 
(von 23) wurde in den Parlamentsdaten vorgefunden (auf mögliche Erklärungen 
für diese Distribution wird im Kapitel 12 eingegangen). 

Auch was das Timing angeht, ist eine deutliche Ähnlichkeit zum Kopfschüt- 
teln merkbar. In den meisten Fällen (20 von 23) dauert die Geste bis zum Ende der 
Intonations- oder Äußerungseinheit an, und in den meisten Fällen wird die ver- 
bale Partikel auch während der Geste geäußert. Allerdings ist letztere Tendenz 
etwas schwächer als beim Kopfschütteln mit einfach: In 8 der 23 Fälle fängt das 
Nicken erst kurz nach der Modalpartikel an. Der Hauptton wird aber in jedem Fall 
von der Geste begleitet, sodass zumindest das vermutlich wichtigste Element des 
Skopus der Abtönung während des Nickens - also während der gestischen Abtö- 
nung - realisiert wird. 

Dass es sich nicht um das ursprüngliche emblematische Nicken handelt, 
lässt sich ähnlich wie beim Kopfschütteln anhand solcher Fälle zeigen, in denen 
die Polaritätsverhältnisse nicht mehr jene des ursprünglichen Emblems sind. 
Deutliche Beispiele mit ja sind in den Daten nicht vorhanden, aber mit eben las- 
sen sich einzelne Belege finden, in denen das Nicken mit einer negierten Aussage 
kombiniert wird. Das Nicken ist hier ähnlich wie die Partikel zu interpretieren: 
Beide bestätigen das Nichtzutreffen des Sachverhaltes, und haben also Skopus 
über die Negation. Es liegt mit anderen Worten keine Konfliktsituation vor, in der 
die Geste das Zutreffen und die verbale Negation das Nichtzutreffen des Sachver- 
haltes markieren würde: Die abtönende Wirkung des Nickens ist nicht in Konflikt 
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mit der Negation, sondern ist - ähnlich wie die Partikel eben - auf einer höheren 
Ebene anzusiedeln. 

Illustriert wird diese Situation in Beispiel (12). Schriftstellerin Hera Lind (HL) 
erzählt hier über ein neues Projekt, in dem sie für eine Zeitschrift über „Super- 
weiber“ berichtet, d. h. über Frauen, die trotz einer besonderen Leistung nicht 
bekannt geworden sind. Die Negation ist hier Teil des Sachverhaltes, der durch 
das Nicken als wahr bzw. unkontrovers markiert wird (die Tatsache, dass sie 
nicht bekannt geworden sind), und liegt also in dessen Skopus. 


(12) FG_B1b 
439 HL und ich bItte (.) um (.) ZUschriften; 
440 ich (.) kOmme die leute beSUchen di (.) 
frauen- 
441 IN ja- 
442 HL und [schrEIbe über ihr SCHICKsal; 
443 IN [(ja und also) 
444 HL für eine beKANNte frAUenzeitschrift; 
445 IN und das sInd ja auch ähm dann VIEle ähm wie 


sagt man, 
446 ja viele inspiratiOnen für neue roMAne wi 
wir schon gehört haben, 
447 HL ja- 


448 IN der Erste [ist schon (.) am entSTEhen ne; 

449 HL [und ich ZIEhe meinen hUt vor 
diesen frauen- 

450 das sind WIRKlich sUperweiber; 


451 IN ja; 
452 HL > {die eben nIcht beKANNT geworden sind-} 


7.4.2 Andere Verwendungskontexte des Nickens 


An dieser Stelle sei noch kurz auf zwei weitere Verwendungskontexte eingegan- 
gen, die oben bereits angesprochen wurden: die Verwendung mit Partikeln des 
Clusters 2b und die Verwendung mit den Intensivierern ganz und sehr. Dass das 
Nicken auch bei den Partikeln des Clusters 2b eingesetzt werden kann, ist darauf 
zurückzuführen, dass die durch die Mitglieder des Clusters 2b markierte Evidenz 
eine gewisse Wahrheit unterstellt; die Geste markiert also eine Facette (bzw. eine 
Implikatur) der Partikelbedeutung. Im Gegensatz zum Kopfschütteln kommt das 
Nicken aber erheblich häufiger bei eben vor: In 10 der 28 Belege von eben mit 
einer Geste (= 35,71%) ist diese Geste ein Nicken, während halt und einfach unter 
10% bleiben. Trotz der niedrigen Belegzahl ist dies eine auffällige Beobachtung, 
zumal die Wahrheitsmarkierung des Nickens eigentlich eine schwächere Nuance 
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ist als die Evidenzmarkierung des Kopfschüttelns, während eben gerade die ka- 
tegorischste Partikel der drei im Cluster 2b zu sein scheint. Allerdings enthielten 
die oben angeführten und an Kendon (2002) orientierten Paraphrasen des Kopf- 
schüttelns eine deutliche subjektive Facette (‚ich weiß nicht‘ o. dgl.), die bei der 
Wahrheitsmarkierung weniger deutlich nachweisbar ist. In der Hinsicht wirkt die 
Wahrheitsmarkierung, obwohl gewissermaßen schwächer als die Evidenzmar- 
kierung, zugleich immerhin objektiver bzw. kategorischer als die Evidenzmarkie- 
rung des Kopfschüttelns, das vor allem subjektive Evidenz andeutet. Das dürfte 
erklären, warum das Nicken dann doch häufiger als das Kopfschütteln bei dem 
objektiveren eben eingesetzt wird, während das stärker sprecherorientierte ein- 
fach das umgekehrte Bild zeigt. 

Interessant ist in dieser Hinsicht auch die Beobachtung, dass die relative 
Häufigkeit des Nickens bei eben (35,71%) höher liegt als bei ja (12,92%)? - wenn- 
gleich aufgrund der niedrigen Belegzahl bei eben eine gewisse Vorsicht geboten 
ist. Vermutlich spielen hier zwei nicht ganz voneinander unabhängige Faktoren 
eine Rolle: zum einen die Tatsache, dass ja eine schwächere und allgemeinere 
Bedeutung zum Ausdruck bringt als eben, zum anderen die stärkere Konkurrenz 
anderer Gesten bei ja. Darauf soll im nächsten Kapitel (insbesondere Abschnitt 
8.2.2.3) ausführlicher eingegangen werden. 

Ähnlich ist auch die Einsetzbarkeit des Nickens mit Intensivierern zu deuten. 
Im Grunde genommen sieht die Erklärung jener des Kopfschüttelns und der Par- 
tikel einfach sehr ähnlich: Wenn man markiert, dass man zum Zutreffen des Sach- 
verhalts steht, wirkt die Äußerung von sich her kategorischer, als wenn man dies 
nicht markiert. Dieses Prinzip trifft gleichermaßen zu, ungeachtet, ob dieses 
Zum-Sachverhalt-Stehen durch einen Wahrheitsmarkierer (Nicken) oder einen 
Evidenzmarkierer (Kopfschütteln) zum Ausdruck gebracht wird. Die genaue Nu- 
ance, die durch die Abtönungsform vermittelt wird, ist zwar unterschiedlich, und 
dementsprechend dürfte die Äußerung mit einer Abtönungsform noch stärker 
wirken als mit einer anderen. Trotzdem kann man sagen, dass der Sprecher in 
den beiden Fällen markiert, dass er zum Zutreffen des Sachverhalts steht, und so 
die Äußerung verstärkt. Auch die Verwendung des Nickens als (bzw. mit einem) 
Intensivierer ist also auf die abtönende Wirkung zurückzuführen. 

Was die Modalpartikeln betrifft, ist allerdings noch hinzuzufügen, dass sich 
das Auftreten des Nickens nicht auf die zentralen Elemente der Cluster 2a/b be- 
schränkt: Auch bei schon sind Belege mit Nicken vorzufinden. An sich ist das 


12 Diese Beobachtung widerspricht allerdings nicht der obigen Anmerkung, ja sei die häufigste 
Partikel mit Nicken, denn letztere Behauptung wurde aus der Sicht des Nickens (und nicht der 
einzelnen Partikeln) gemacht. 
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nicht verwunderlich, da schon im Grunde genommen auch eine Art Wahrheits- 
markierer ist. Schon ist jedoch nicht ganz einer Partikel wie ja gleichzusetzen, da 
es immer auch eine Art Geltungseinschränkung (Thurmair 1989: 148) impliziert. 
Diese Geltungseinschränkung kann sich auf die eigene schon-Äußerung bezie- 
hen, aber im Korpus ist das Nicken mit schon nur in Fällen wie (13) belegt, in de- 
nen mittels schon mögliche Gegenargumente oder Einwände in ihrer Gültigkeit 
eingeschränkt werden. Die Rede ist von einer Situation, in der ein Telekomanbie- 
ter trotz Kündigung mit Beifügung der Sterbeurkunde des Vertragsinhabers den 
Vertrag nicht hat auflösen wollen. Die Sprecherin nennt diese Situation „bedau- 
erlich“ und weist durch schon etwaige Einwände gegen diese Einstufung der Si- 
tuation als bedauerlich zurück. Die Partikel unterstreicht also, dass das Gesagte 
(„das ist bedauerlich“) der Sprecherin zufolge als wahr gelten kann, und gerade 
das ist auch die Funktion des Nickens. 


(13) FG_Blc 
156 IN ist das jetzt ein EINzelfall oder erleben 


sie mEhr solche fälle. 
157 IG sowas kOmmt schon immer mal WIEder vor, 
158 so beDAUerlich das auch Ist, 
159 zumal hier ja wirklich ähm letztendlich der 
Anbieter da überhaupt nicht geSCHALltet hat, 
160 > {das IST (.) schon (-) bedAUerlich; (---)} 


Zum Schluss sei noch darauf hingewiesen, dass die Datensammlung auch 
vier Belege des Nickens mit einer Entscheidungsfrage enthält. Diese sind bei den 
obigen Zählungen (die sich nur auf die Beziehung zu ja und bedeutungsähnli- 
chen Elementen in Assertionen bezogen) außer Betracht geblieben, aber im Hin- 
blick auf das Verhältnis zur Partikel ja erscheinen diese Belege als besonders in- 
teressant. Tatsächlich wurde in der Literatur schon nachgewiesen, dass die 
Partikel ja im Althochdeutschen noch in Entscheidungsfragen eingesetzt werden 
konnte, um eine positive Antworterwartung zu signalisieren (ausführlicher dazu 
Wauchope 1991).? Gerade das scheint auch die Funktion des Nickens mit einer 
Entscheidungsfrage zu sein, wie in Beispiel (14). Für ein gutes Verständnis des 
Beispiels sei angedeutet, dass hier von Horst Lichters (HO) neuer Theatertournee 
die Rede ist, in der seine Erfahrung als Fernsehkoch, wie auch das Kochen im 
Allgemeinen, ein zentrales Thema ist. Zwar handelt es sich in diesem Fall um eine 
direkte Rede, aber trotzdem übernimmt Lichter hier das Nicken, das angibt, dass 


13 Diese Funktion wird heutzutage im Allgemeinen der Partikel auch zugeschrieben (vgl. u. a. 
Thurmair 1989: 157). 
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die zitierten Personen durchaus darauf hoffen, etwas probieren zu können (und 
also eine positive Antwort zu bekommen) (vgl. zu dieser Verwendung des Ni- 
ckens auch Whitehead 2011: 113). 


(14) FG_Blc 
546 IN g gibt=s denn gIbt=s denn noch menschen die 
bei dir im proGRAMM sind, 


547 und dann Elgentlich (.) ESsen bestellen 
wollen, 

548 und erwarten dass du jetzt oben gAs gibst 
und was KOCHST [für die belegschaft? 

549 HO [ja ich werde hÄUfiger mal 
geFRAGT, 

550 die sAgen dann herr LICHter, 

Sol: wenn sie dA und da im theATer sind- 

552 > äh [{kriegen wir ALle wat zum problIEren?} 

553- -IN [was GIBT=s denn; 


Es zeigt sich also, dass das Nicken ähnlich wie das Kopfschütteln neben sei- 
ner emblematischen Wirkung auch eine abtönende Wirkung aufweist, die an ers- 
ter Stelle mit den Partikeln der Cluster 2a/b zu verknüpfen ist. Insbesondere gibt 
es Übereinstimmungen mit der Partikel ja. Allerdings kann hier nicht von einer 
starken Korrelation ausgegangen werden, was auf die Allgemeinheit der Bedeu- 
tung von ja sowie auf die damit zusammenhängende Konkurrenz anderer Gesten 
zurückzuführen sein dürfte. Darauf soll im nächsten Kapitel ausführlicher einge- 
gangen werden. 


7.5 Fazit 


Am Ende dieser ersten Fallstudie sind einige Sachen festzuhalten. Es hat sich her- 
ausgestellt, dass die Partikeln der Cluster 2a/b Tendenzen zur Kookkurrenz mit 
bestimmten Gesten aufweisen, die zudem ein neues Licht auf das Verhältnis der 
Partikeln untereinander sowie zu anderen verbalen Elementen (insbesondere In- 
tensivierern) werfen. Darüber hinaus hat sich der Wert eines breiten Gestikbe- 
griffs, der auch Kopfbewegungen umfasst, deutlich gezeigt, denn die beiden Be- 
wegungsmuster, auf die eingegangen wurde, sind gerade Kopfgesten (Nicken 
und Kopfschütteln). Drittens wurde dargelegt, dass diese Gesten nicht nur als 
Embleme der expliziten Bejahung bzw. Verneinung funktionieren, sondern dar- 
über hinaus auch pragmatische Verwendungen erworben haben, die als abtö- 
nend zu betrachten sind. Dies zeigt sich nicht nur darin, dass diese Gesten (wie 
angesprochen) mit Modalpartikeln kookkurrieren, sondern auch etwa in ihrer 
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Dauer, die im Allgemeinen den normalerweise breiten Skopus von Abtönungs- 
mitteln widerspiegelt. Interessant ist in dieser Hinsicht auch die Beobachtung, 
dass das abtönende Kopfschütteln insbesondere in nicht-kontextverschobenen 
Kontexten vorkommt; Sprecher scheinen also eher geneigt zu sein, eine abtö- 
nende Geste zu verwenden, wenn sie selber für die Abtönung verantwortlich 
sind. Inwiefern sich diese Beobachtungen generalisieren lassen, ist jedoch an 
dieser Stelle schwer zu sagen und soll in den folgenden Kapiteln anhand weiterer 
abtönender Gesten gezeigt werden. 


8 Fallstudie 2: Intersubjektive Zeigegesten 


8.0 Einführung 


Nachdem im vorigen Kapitel einige Kookkurrenzmuster von Modalpartikeln mit 
Kopfgesten besprochen wurden, soll im Folgenden auf eine abtönende Handge- 
ste eingegangen werden: das intersubjektive Deiktikum. Was die Kookkurrenz 
mit Modalpartikeln betrifft, wird diesmal eine Partikel des Clusters 2a fokussiert: 
die Partikel ja. Diese Partikel wurde auch im vorigen Kapitel im Rahmen der Be- 
sprechung des Nickens schon erwähnt. Auf die Tatsache, dass diese Partikel mit 
mehreren Gesten ein im Rahmen der vorliegenden Arbeit zu besprechendes 
Kookkurrenzmuster aufweist, soll im Laufe dieses Kapitels (besonders im Ab- 
schnitt 8.2.2.3) ausführlicher eingegangen werden. 

Da hauptsächlich die gleichen Aspekte der Geste bzw. ihrer Kookkurrenz mit 
der verbalen Partikel relevant sind wie im vorigen Kapitel, ist der Aufbau des Ka- 
pitels vergleichbar. Nur enthält dieses Kapitel keinen Exkurs zur Distribution ei- 
ner anderen Geste; stattdessen wird im Abschnitt 8.3 auf die Abgrenzung gegen- 
über und die Interaktion mit anderen Arten von Zeigegesten eingegangen. Zuvor 
aber wird kurz geklärt, was unter der Bezeichnung ‚intersubjektives Deiktikum‘ 
zu verstehen ist (8.1) und wie das Kookkurrenzmuster dieser Geste mit der Parti- 
kel ja zu analysieren ist (8.2). Letzterer Abschnitt enthält auch gleich eine Über- 
sicht der weiteren Verwendungskontexte der Geste. 


8.1 Intersubjektives Deiktikum 


Im Gegensatz zu den Kopfgesten, die im vorigen Kapitel besprochen wurden, 
handelt es sich bei dem intersubjektiven Deiktikum um eine Handsgeste. Dies im- 
pliziert, dass für die Beschreibung der Geste die Zahl der zu berücksichtigenden 
Formparameter größer ist als im vorigen Kapitel (vgl. dazu Abschnitt 6.2). Aus 
diesem Grund besteht diese Vorstellung des intersubjektiven Deiktikums aus 
zwei Teilen: Zunächst (8.1.1) wird auf die Funktion der Geste sowie auf ihr Ver- 
hältnis zu anderen Gesten eingegangen, und in einem zweiten Schritt (8.1.2) wird 
diese Beschreibung weiter verfeinert, indem auf die relevanten Formparameter 
eingegangen wird. 
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8.1.1 Abgrenzung und Funktion des intersubjektiven Deiktikums 


Im dritten Kapitel wurde bereits darauf hingewiesen, dass sich die Deiktika oder 
Zeigegesten nach ihrer Funktion in mehrere Gruppen aufteilen lassen. Die zwei 
für vorliegende Arbeit wichtigsten Kategorien von Zeigegesten sind die referenti- 
ellen und die intersubjektiven. Als referentiell werden Deiktika eingestuft, wenn 
sie dazu dienen, eine typischerweise konkrete Entität (Person, Objekt o. dgl.) an- 
zuzeigen, um sie als den gemeinten Referenten zu identifizieren, die Prominenz 
des Angezeigten zu erhöhen oder die Aufmerksamkeit darauf zu lenken; aufihre 
Rolle in Abtönungskontexten soll im Abschnitt 10.1 noch ausführlicher eingegan- 
gen werden. Dagegen zeigt man mit intersubjektiven (oder ‚interaktiven‘) Deik- 
tika auf den Gesprächspartner als Gesprächspartner. Die Funktion ist also nicht 
primär referentiell (zum Beispiel die Identifikation des Referenten eines Prono- 
mens in der zweiten Person), sondern sie ist vielmehr auf der pragmatischen 
Ebene anzusiedeln. 

Typischerweise ist die Wirkung des intersubjektiven Deiktikums mit Über- 
einstimmung oder Einverständnis zu verknüpfen. Am ausführlichsten analysiert 
wurde bislang die Verwendung dieser Geste als Reaktion auf die Äußerung, mit 
der man sich einverstanden zeigt (u. a. Müller 1996: 201 fürs Deutsche und Healy 
2012: 12 fürs Englische). In dieser Verwendung kann die Geste ein reines Rück- 
meldesignal (sog. ‚back-channel‘) sein, das ggf. von einem verbalen Einverständ- 
nismarkierer begleitet wird, aber es kann auch eine Äußerung begleiten, die auf 
die Äußerung reagiert, mit der man einverstanden ist. 

Darüber hinaus kann die intersubjektive Zeigegeste allerdings auch die An- 
nahme von Bekanntheit oder Einverständnis zeigen, ähnlich wie die Partikel ja. 
Tatsächlich listet Holler (2010: 12) die Zeigegeste im Englischen als eine der soge- 
nannten „shared information gestures“ auf und umschreibt ihre Bedeutung als 
‚wie du weißt‘. Wie die folgende Analyse zeigen wird, lässt sich diese Verwen- 
dung der Zeigegesten auch im Deutschen nachweisen. Allerdings wird sich her- 
ausstellen, dass Hollers Paraphrase etwas erweitert werden sollte, denn ähnlich 
wie die Partikel ja deutet das intersubjektive Deiktikum nicht unbedingt auf Be- 
kanntheit im engsten Sinne. Weitere mögliche Nuancen sind (u. a.) ‚wie du gesagt 
hast‘ und ‚wie du wohl von mir annehmen wirst‘. 

Darüber hinaus kann das intersubjektive Deiktikum auch mit fragenden Äu- 
ßerungen verwendet werden. In dem Fall markiert die Geste, dass Einverständnis 
gesucht wird. Es wird mit anderen Worten auf eine bestätigende Antwort zuge- 
steuert. In dieser Hinsicht ähnelt das intersubjektive Deiktikum den Partikeln 
auch (in Entscheidungsfragen) und doch (in Bestätigungsfragen) sowie der Ver- 
wendung des Nickens mit Fragen, die im vorigen Kapitel angesprochen wurde. 
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Mangels genügend Belege im Korpus soll jedoch an dieser Stelle nicht weiter da- 
rauf eingegangen werden. 


8.1.2 Form des intersubjektiven Deiktikums 


Wie bereits im dritten Kapitel angedeutet wurde, weisen die Zeigegesten eine be- 
achtliche Formenvielfalt auf, ohne dass sich ein klares Eins-zu-eins-Verhältnis 
zwischen einer bestimmten Form der Zeigegeste und einer bestimmten Funktion 
nachweisen ließe. Allerdings dürften sich durchaus Tendenzen diesbezüglich 
aufdecken lassen. Daher soll im Folgenden kurz auf die vier im Abschnitt 6.2.1 
aufgelisteten Formparameter für die Gestikbeschreibung eingegangen werden. 
Dabei wird das intersubjektive Deiktikum im Allgemeinen besprochen, d. h. un- 
abhängig davon, ob eine verbale Modalpartikel vorliegt oder nicht. An einigen 
Stellen werden jedoch die Angaben zu den Deiktika in Kombination mit der Par- 
tikel ja (die im weiteren Verlauf des Kapitels im Zentrum der Beobachtung stehen 
wird) mit denen für die weiteren Belege der Geste verglichen. Wie sich erwarten 
ließe, lassen sich hier allerdings keine signifikanten Unterschiede aufdecken. 

Was die Form der Hand betrifft, fällt besonders auf, dass das Fingerzeigen 
(d. h. das Zeigen mit einem ausgestreckten Finger, typischerweise dem Zeigefin- 
ger), das gelegentlich als die prototypische Handform bei Zeigegesten betrachtet 
wird (u. a. Franco/Butterworth 1996: 308), eher selten ist: Nur fünf von 105 in- 
tersubjektiven Deiktika im Korpus - zwei davon mit der Partikel ja - weisen diese 
Form auf. Deutlich häufiger belegt sind die flache Hand (31 Belege, d. h. 29,52%) 
und insbesondere die etwas lockerere Variante dieser Handform, die Schüssel- 
hand (62 Belege, d. h. 59,05%). Die Handformen, die sich als ‚geöffnete Hand‘ 
umschreiben lassen, sind also deutlich stärker vertreten. Die An- oder Abwesen- 
heit der Partikel ja hat keinen großen Einfluss auf die Distribution der Handfor- 
men: Von den 47 intersubjektiven Zeigegesten mit ja sind 13 (27,66%) als flache 
Hand und 27 (57,45%) als Schüsselhand zu betrachten. 

Diese Dominanz der geöffneten Handformen soll an sich nicht wundern. Tat- 
sächlich wurde schon für mehrere Sprachen bzw. Kulturen (u. a. Kendon/Ver- 
sante 2003 fürs Neapelitalienische und Wilkins 2003 fürs Arrernte) gezeigt, dass 
das Fingerzeigen insbesondere für „object individuation“ (Kendon/Versante 
2003: 115) eingesetzt wird, d. h. um ein bestimmtes Objekt zur Referenzidentifi- 
zierung, Aufmerksamkeitssteuerung o. dgl. auszusondern. Dies ist nicht die 
Funktion des intersubjektiven Deiktikums: Es ist insofern referentiell, als es die 
Person andeutet, mit der Einverständnis gesucht wird, aber seine Funktion ist 
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doch eher einverständnisbezogen als aussondernd. Die Daten legen nahe, dass 
die Tendenzen im Deutschen nicht wesentlich anders sind. 


Abb. 14: Intersubjektives Deiktikum mit flacher Hand (links, FG_A4b) und mit Schüsselhand 
(rechts, FG_B1a) 


Darüber hinaus wird das Fingerzeigen, gerade aufgrund seiner aussondern- 
den Wirkung, vielfach als unhöflich betrachtet, wenn man damit auf Personen 
zeigt. Daher wird beim Zeigen auf Personen sowieso häufiger die geöffnete Hand 
verwendet, unabhängig davon, ob die Zeigegeste referentiell oder intersubjektiv 
zu interpretieren ist (vgl. dazu auch Müller 1996). Der Grund dürfte sein, dass die 
geöffnete Hand im Vergleich zum Einzelfinger als Zeigegeste etwas weniger prä- 
zise erscheinen dürfte und daher weniger direkt, aussondernd und offensiv wir- 
ken dürfte. Die Tatsache, dass die Schüsselhand etwas häufiger als die flache 
Hand eingesetzt wird, dürfte auf die Grammatikalisierung der Geste zurückzu- 
führen sein, in dem Sinne, dass mit dem Zurücktreten der referentiellen Wirkung 
auch die Verbreitung einer lockereren, im Hinblick auf die Identifizierung des 
Angezeigten etwas unpräziseren Handform einherginge.' 

Was die Orientierung der Geste betrifft, ist es nicht verwunderlich, dass die 
Finger immer vom Körper des Sprechenden abgewandt sind. Tatsächlich wird mit 
der intersubjektiven Zeigegeste die Person angezeigt, mit der man Einverständnis 
unterstellt, und das ist typischerweise nicht der Sprecher selber, sondern der Ge- 
sprächspartner. Die genaue Orientierung der Finger ist dementsprechend davon 
abhängig, wo sich der Gesprächspartner vis-à-vis dem Sprecher befindet. 

Im Hinblick auf die Orientierung der Handfläche weisen die Belege des in- 
tersubjektiven Deiktikums mehr Variation auf. Ähnlich wie bei der Handform 
sind aber zwei Realisierungsvarianten deutlich stärker vertreten als die anderen: 
‚palm to center‘ (51 Belege = 48,57%) und ‚palm up-center‘ (34 Belege = 32,38%). 


1 Ausführlicher zur Grammatikalisierungsfrage: Kapitel 13. 


Intersubjektives Deiktikum —— 139 


Weitere 12,38% (13 Belege) werden als ‚palm up‘ realisiert; in den sieben verblei- 
benden Belegen wird diese Orientierung nicht erreicht (durch Interaktion mit an- 
deren Gesten oder weil es sich um eine abgeschwächte Wiederholung handelt, 
vgl. Kapitel 11). 

Auf der Ebene der Bewegung ist zunächst darauf hinzuweisen, dass das in- 
tersubjektive Deiktikum an sich keine Bewegungsgeste im Sinne von Leonhard 
(1976) ist. Das heißt, dass die etwaige Bewegung nicht für die Bedeutung der 
Geste konstitutiv ist, sondern dass die Bedeutung vor allem durch die Form und 
die Haltung der Hand vermittelt wird; etwaige Bewegungen sind vor allem in der 
Vorbereitungsphase anzusiedeln und dienen dazu, die Hand in die richtige Posi- 
tion zu bringen. Bewegungen während des Strokes sind dementsprechend eher 
selten. Es sind nur drei solche Fälle im Korpus vorhanden, die allesamt den Par- 
lamentsdaten entstammen. In diesen drei Fällen wird die ausgestreckte Hand 
seitlich bewegt. Vermutlich liegt der Grund darin, dass der Sprecher jeweils mit 
mehreren (bzw. gar allen) Parlamentariern im Saal Einverständnis andeuten will. 
Infolge der Größe und Einrichtung des Plenarsaals im Parlament ist es schwierig, 
auf alle Abgeordneten gleichzeitig zu zeigen, sodass der Sprecher die offen ge- 
haltene Hand seitlich bewegt, um sozusagen einen nach dem anderen doch auf 
jeden Abgeordneten zu zeigen. Theoretisch wäre es auch in kleineren Settings 
wie Talkshows möglich, mit zwei Personen Einverständnis zu zeigen, indem man 
das intersubjektive Deiktikum zunächst auf die eine, danach auf die andere Per- 
son richtet. Davon sind allerdings im Korpus keine Belege vorhanden. Festzuhal- 
ten bleibt jedenfalls, dass solche bewegten intersubjektiven Deiktika eher den 
Ausnahmefall darstellen, und dass im Allgemeinen beim Stroke die Hand still 
gehalten wird. 

Was die Position im Gestenraum betrifft, fällt an erster Stelle auf, dass die 
Geste meist nicht im oberen Teil des Gestenraums realisiert wird, sondern viel- 
mehr (mit den Bezeichnungen von Kipp et al. 2007) im Bereich der Brust (‚chest‘) 
oder des Abdomens. Bei den zwölf Ausnahmebelegen, die auf Schulterhöhe rea- 
lisiert werden, ist meist eine deutliche Erklärung zu finden in der Bewegungsfrei- 
heit des Sprechers (externe Faktoren wie zum Beispiel ein Rednerpult verhindern 
eine tiefere Realisierung der Geste) oder aber in der Tatsache, dass sich die ange- 
zeigte Person höher befindet als der Sprecher (im Parlament zum Beispiel in der 
Regierungsbank, die sich hinter und oberhalb der Rednerbühne befindet, wie in 
Abbildung 15). 


2 Interessant ist die Beobachtung, dass ja relativ häufiger mit ‚palm up‘ (19,15%) und seltener 
mit ‚palm to center‘ (36,17%) kombiniert wird. Worauf dieser Unterschied zurückzuführen ist, 
muss an dieser Stelle jedoch dahingestellt bleiben. 
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Abb. 15: Intersubjektives Zeigen auf eine Person in der Regierungsbank (PR_Schü0811) 


An sich sind diese Ergebnisse im Einklang mit Müllers (1996: 214f.) Beobach- 
tung, dass „das Deuten mit der flachen Hand auf Bauch- oder Brusthöhe ausge- 
führt wird“, also eher „am Rande des Gesichtsfeldes der Interaktionspartner“, 
was seinerseits mit der höflicheren und weniger direkten Natur dieser Zeigegeste 
im Vergleich zum Fingerzeigen zusammenhängt. Damit zu verknüpfen ist auch, 
dass die Geste im Korpus meist in der Peripherie oder im unteren Teil des Zent- 
rumsbereiches (‚center‘) des Gestenraumes realisiert wird. Nur sechs Mal wird sie 
im Kernbereich des Gestenraumes (d. h. in der Zone, die McNeill als ‚center cen- 
ter‘ bezeichnet) realisiert. In vier der sechs Fälle ist dieses ‚abweichende‘ Beneh- 
men des Sprechers nicht unlogisch. Wenn die angeredete Person dem Sprecher 
nicht direkt gegenübersitzt bzw. -steht, verwendet der Sprecher bei der Realisie- 
rung des intersubjektiven Deiktikums (wenigstens in meinen Daten) meist die 
Hand auf der Seite, auf der sich der Gesprächspartner befindet, was dann meis- 
tens zu einer Realisierung im Zentrumsbereich oder in der Peripherie führt. Wenn 
allerdings diese Hand aus irgendeinem Grund nicht verwendet werden kann 
(zum Beispiel, weil der Sprecher in der Hand sein Mikrofon hält), wie in diesen 
vier Belegen der Fall ist, so benutzt der Sprecher die andere Hand, richtet sie 
dann aber immer noch auf den Gesprächspartner, der auf der anderen Seite sitzt 
bzw. steht, und hält die Hand also nach innen bzw. im Kernbereich. 


Abb. 16: Intersubjektives Deiktikum mit der weiter entfernten Hand (FG_A1a) 
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8.2 Intersubjektives Deiktikum und ja 


8.2.1 Funktionale Übereinstimmung 


Oben wurde bereits mehrfach darauf hingewiesen, dass das intersubjektive Deik- 
tikum eingesetzt werden kann, um Einverständnis zu markieren oder anzudeu- 
ten, dass es sich bei der Äußerung, die sie begleitet, um geteiltes Wissen handelt. 
Dies erinnert an die im Abschnitt 2.3.2 gelieferte Beschreibung einer der zentralen 
Partikeln des Clusters 2a: ja. Aus diesem Grund soll im Folgenden das Kookkur- 
renzverhalten der intersubjektiven Zeigegeste mit dieser Partikel eingehender be- 
sprochen werden. 

Aufgrund der gemeinsamen Funktion, Bekanntheit (bzw. geteiltes Wissen) 
zu markieren, ist es nicht verwunderlich, dass das intersubjektive Deiktikum und 
die Partikel ja häufiger gemeinsam vorkommen, wie in Beispiel (1). In diesem Bei- 
spiel unterhalten sich Moderator Ingo Nommsen (IN) und Studiogast Mike Krüger 
(MK) über die bevorstehende Aufnahme einer großen Fernsehshow im Salzkam- 
mergut, bei der auch Charlie Chaplins Tochter Geraldine anwesend sein soll. Ge- 
sprächsthema ist die Frage, wie es bei solchen Shows hinter der Bühne zugeht. 
Da Krüger aufgrund seiner langen Karriere viel Erfahrung mit solchen Shows hat, 
geht Nommsen davon aus, dass ihm auch bewusst ist, dass nicht mehr alles so 
wie früher abläuft, und dies markiert er sowohl verbal (durch die Partikel ja) als 
auch gestisch (durch die Zeigegeste). 


(2) FG_Bla 
420 IN im SALZkammergut [da kann man gut 1lUstig 
sein; 
421 MK [ja; 
422 da ma dA kann man gut LUStig sein;= 
423 =beSONders mit (.) der tochter eines der 


größten äh komiker die es so gAb; 

424 IN JA. 

425 hey äh hat man da überhaupt g gelEgenheit 
bei solchen shows mit den stars dann hinter 
der BÜHne mal,= 


426 > =s Ist ja {nicht mehr so wie FRüher; } 
427 ihr HABT ja früher, 

428 HÖRT man immer wIEder; 

429 recht LANG gefElert; 
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Abb. 17: Intersubjektives Deiktikum mit ja 


Allerdings wurde sowohl bei der Partikel als auch bei der Geste darauf hin- 
gewiesen, dass es sich bei Bekanntheit und geteiltem Wissen ‚nur‘ um zentrale 
Facetten der Bedeutung dieser Elemente handelt, die nicht deren ganzen Funkti- 
onsbereich abdecken. Für die Zeigegeste wurden als beispielhafte weitere Para- 
phrasen noch ‚wie du gesagt hast‘ und ‚wie du wohl von mir annehmen wirst‘ 
geliefert, und für ja wurde die Möglichkeit der Einstufung als Wahrheits- oder 
Einverständnismarkierer angesprochen. Tatsächlich ist weder bei der Partikel 
noch bei der Geste die Bekanntheit in jedem einzelnen Beleg gleich offensicht- 
lich. Interessant sind in dieser Hinsicht Belege wie (2): Aus dem weiteren Verlauf 
des Gesprächs ist klar, dass IN noch nicht bekannt war, dass HO immer schon 
gegen Fonds war, obwohl hier die Partikel ja und ein intersubjektives Deiktikum 
eingesetzt werden. Es ist kein rein perfider Gebrauch im Sinne von Reiter (1985) 
(vgl. dazu Abschnitt 2.3.2), da der Sprecher hier nicht durch die Verwendung der 
Partikel bzw. der Geste Einwände des Gesprächspartners explizit verhindern 
möchte. Trotzdem ähnelt dieser Fall dem Beispiel (3) (= Beispiel (20) aus Kapitel 
2) insofern, als die Bekanntheit des Sachverhalts weniger offensichtlich ist als in 
(1) bzw. höchstens rhetorisch in den Gesprächspartner hineinprojiziert wird: Der 
Sachverhalt gehörte vorhin nicht zur gemeinsamen Wissensbasis (‚common 
ground‘), wird aber vom Sprecher (HO) so gerahmt, dass ihn der Hörer (IN) ohne 
weitere Hinterfragung annehmen dürfte bzw. sollte. 


(2) FG_B1c 

297 IN was würdest dU mit fünfunddreißig milLIOnen 
machen? 

298 HO äh ich bin mir zIEmlich sicher dass ich 
dreißig millionen KOMplett verschenke, 

299 IN mhm; 

300 HO ich weiß an wEn und woHIN, 

301 und äh fünf millionen würd ich schön ANlegen, 

302 mit den zInsen könnt ich hervorragend LEben, 
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303 und dann würd ich ein bisschen mEhr arbeiten 
weil ich hätte keine SORgen mehr; 

304 IN mhm? 

305 HO JA. 

306 man kAnn ja dann ein bisschen MEHR tun, 

307 weil da hAst ja nur noch FREUde. 

308 IN JA; 

309 HO mUsst dich um nix mehr KÜMmern, 

310 und du weißt gAnz geNAU, 

311 die drEIRŘig die hast du SO verteilt- 

312 dAt (.) klappt allet WUNderbar, 

313 fünf geben so viele ZINsen, 

314 bei vIEr proZENT, 

315 Ohne dat du da so ne scheißAKtie kaufen 
musst; 

316 > und {fOnds war ich ja IMmer schon gegen, } 

31% überLEG mal, 

318 IN also (-) finAnzkrise hat dich nicht SO 
getroffen; 

(3) Würden Sie bitte weiter durchgehen! - Nein, ich muss ja nächste Station 


schon aussteigen! 
(Rinas 2007: 205) 


Allerdings legen die Daten nahe, dass die Bedeutungsverblassung bei ja 
deutlich weiter vorangeschritten ist als bei der Geste. Das heißt, dass solche Fälle, 
in denen die Bedeutung der Bekanntheit bzw. des geteilten Wissens nicht mehr 
so deutlich nachweisbar ist, bei der Partikel häufiger vorzuliegen scheinen als bei 
der Geste, was sich auch auf das Kookkurrenzverhalten auswirkt. Tatsächlich ist 
(2) der einzige Beleg des intersubjektiven Deiktikums mit verblasster Bedeutung 
im Korpus. In der Hinsicht scheint die Partikel ja eine breitere Bedeutungs- bzw. 
Verwendungsskala aufzuweisen als die intersubjektive Zeigegeste. Darauf soll im 
Abschnitt 8.2.2.3 ausführlicher eingegangen werden. 


8.2.2 Stärke der Korrelation 


8.2.2.1 Kookkurrenz von intersubjektivem Deiktikum und ja 

Im Hinblick auf die funktionale Übereinstimmung zwischen dem intersubjekti- 
ven Deiktikum und der Partikel ja ist es nicht verwunderlich, dass ja die Partikel 
ist, die am häufigsten mit der Zeigegeste kombiniert wird. Von den 105 intersub- 
jektiven Deiktika im Korpus sind 47 (= 44,76%) mit einer verbalen Äußerung zu 
verknüpfen, die die Partikel ja enthält. Wenn man darüber hinaus berücksichtigt, 
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dass 12 weitere Belege der Geste (= 11,43%) mit einem anderen Element des Clus- 
ters 2a kookkurrieren (ausführlicher dazu Abschnitt 8.2.2.2), so lässt sich festhal- 
ten, dass das intersubjektive Deiktikum durchaus eine eher starke Beziehung zu 
den Elementen des Clusters 2a - und insbesondere zur Partikel ja — aufweist. 

In der anderen Richtung ist die Beziehung wesentlich weniger stark. Insge- 
samt enthält das Korpus 475 Belege der Modalpartikel ja, bei denen der Sprecher 
zu sehen ist. Die 47 Belege, die mit einem intersubjektiven Deiktikum kookkur- 
rieren, machen also nur knapp ein Zehntel (9,89%) der Belege der Partikel ja aus. 
Lässt man die Belege außer Betracht, in denen keine abtönungsliierte Geste rea- 
lisiert wird, so steigt der Anteil der Belege mit intersubjektivem Deiktikum auf 
26,40% (47 von 178) an. In gut einem Vierteil der Belege ist also die abtönungsli- 
ierte Geste bei ja als ein intersubjektives Deiktikum zu analysieren. Das ist ein 
nicht zu vernachlässigender Anteil, aber trotzdem ein kleinerer Anteil als etwa 
jener des Kopfschüttelns bei der Partikel einfach (vgl. Abschnitt 7.2.2). 

Immerhin ist das intersubjektive Deiktikum damit noch die häufigste Geste 
mit abtönender Bedeutung bei der Partikel ja. Mit 47 Belegen ist es tatsächlich 
ungefähr doppelt so häufig belegt wie das Nicken, das im vorigen Kapitel ange- 
sprochen wurde und das mit insgesamt 23 Belegen an zweiter Stelle steht. Dieser 
Unterschied ist vor allem auf die Parlamentsdaten zurückzuführen: In den Fern- 
sehdaten (Talkshows + Sportberichten) ist das Nicken mit 22 Belegen nicht we- 
sentlich seltener als das intersubjektive Deiktikum mit 28 Belegen, aber in den 
Parlamentsdaten ist das Nicken nur einmal belegt, während die Zeigegeste 19 Be- 
lege hat. Es sieht also danach aus, dass die allgemeine Seltenheit von Kopfgesten 
in Parlamentsreden, die bereits im vorigen Kapitel angesprochen wurde und auf 
die in Kapitel 12 ausführlicher eingegangen werden soll, auch hier eine Rolle 
spielt. 


8.2.2.2 Andere Verwendungskontexte des intersubjektiven Deiktikums 
Ähnlich wie bei der Kombination des Kopfschüttelns mit der Partikel einfach 
scheint es an dieser Stelle angebracht, kurz einen Blick auf die weiteren Kontexte 
zu werfen, in denen das intersubjektive Deiktikum eingesetzt wird. Wie auch im 
vorigen Kapitel wird dabei ein Unterschied gemacht zwischen den Fällen, in de- 
nen die Geste mit einem bedeutungsmäßig der ja ähnelnden Ausdruck kombi- 
niert wird, und denjenigen Fällen, in denen kein lexikalisches Pendant vorliegt. 
Zunächst zur anderen zentralen Partikel des Clusters 2a: doch. Auch diese 
tritt im Korpus zusammen mit einem intersubjektiven Deiktikum auf, allerdings 
in nur vier Belegen. Damit ist das Deiktikum nicht die häufigste abtönende Geste 
bei doch, was darauf zurückzuführen sein dürfte, dass doch im Vergleich zu ja 
auf Bedeutungsebene zusätzlich eine Adversativitätskomponente enthält, die bei 
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dem intersubjektiven Deiktikum ebenfalls nicht so deutlich nachweisbar ist. In 
(4), zum Beispiel, besteht die Adversativität darin, dass die Zuschauerfrage, die 
am Anfang des Ausschnitts gestellt wird, im Grunde genommen überflüssig ist, 
da bekannt sein dürfte, dass Hera Lind (HL), die insbesondere wegen ihrer Frau- 
enromane bekannt ist, eigentlich auch ‚Männerbücher‘ schreibt. Die Geste mar- 
kiert zwar diese Bekanntheit, aber die Adversativität ist nicht so deutlich in ihr 
anwesend und wird vor allem verbal durch doch markiert. 


(4) FG_B1b 
954 IN der FRAGT, 
955 ‚was Ich eine sehr wichtige FRAge find 
956 warum schrEIben sie nicht endlich mal ein 
MÄNnerbuch? 
957 HL [<<lacht>dAs ist aber> 
958 IN [sAgen sie nicht das SIND alles männerbücher, 


959 HL wenn er mal ElInes gelesen hat dann 
diskuTIEren wir mal drüber; 


960 s kommen IMmer männer darin vOr; 

961 I jajA es kommen immer männer darin VOR, 

962 [aber mal ein mAnn 

963 HL [und die sEhen meistens ALT aus ja. 

964 I ja ich wOllt grad SAgen, 

965 mAl über einen GUT aussehenden; 

966 HL > TU i{ch doch, } 

967 I erFOLGreichen; 

968 HL am Ende sind die IMmer gut aussehend; 

969 I am ENde; 

970 ja aber erst wenn sich die frAUen darum 
geKÜMmert haben ne, 


971 HL geNAU. 


Auch zwei Partikeln des Clusters 2b, eben und halt, kookkurrieren in einzel- 
nen Fällen mit der intersubjektiven Zeigegeste: Das Korpus enthält einen Beleg 
der Partikel halt und einen Beleg der Kombination halt eben mit intersubjektivem 
Deiktikum. Dass diese Partikeln auch mit der Zeigegeste kookkurrieren können, 
ist auf die Verwandtschaft der Cluster 2a und 2b zurückzuführen: Wenn ein Sach- 
verhalt evident ist, so impliziert das, dass er als wahr gelten kann bzw. dass Ein- 
verständnis darüber bestehen sollte. Gerade das war auch der Grund, warum im 
zweiten Kapitel der Cluster um eben, einfach und halt Cluster 2b (und nicht Clus- 
ter 3) genannt wurde. 

Beispiel (5) illustriert die Verwendung des intersubjektiven Deiktikums mit 
halt. In diesem Beispiel ist die Rede von einem Gericht (Rührei mit Kondens- 
milch), das Horst Lichter gerade eben in der Sendung zubereitet hat. Dabei hat er 
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einige Geheimtipps verraten, was Moderator Ingo Nommsen dazu führt, zu sa- 
gen, das „der gelernte Koch“ (also Lichter) alle Tricks kennt. Durch die Partikel 
halt markiert er diese Aussage als außer Frage gestellt, und die Geste deutet an, 
dass er tatsächlich keinen Widerspruch erwartet. 


(5) FG_B1c 
376 IN frühstück mit (-) horst LICHter, 
377 inem wUnderbaren (.) rührei mit 
konDENSmilch, 
378 das mAch ich mir zuhause demnächst AUCH; 
379 also, 
380 > {MERKT man halt; (.) 
381 d}er gelErnte koch kennt alle TRICKS ne- 


Neben diesen ‚typischen‘ Modalpartikeln sind auch beim intersubjektiven 
Deiktikum Belege vorhanden, in denen die Geste mit weniger zentralen Mitglie- 
dern des Clusters 2a kookkurriert. Es handelt sich zum einen um das Adverb na- 
türlich, das auch im vorigen Kapitel bereits angesprochen wurde und dessen Vor- 
kommen mit dem intersubjektiven Deiktikum sich durch die gerade erwähnte 
Nähe des Clusters 2b zum Cluster 2a erklären lässt, zum anderen aber auch um 
die Ausdrücke wie Sie wissen, wie gesagt und bekanntlich, die sich direkt mit der 
oben gelieferten Bedeutungsbeschreibung des intersubjektiven Deiktikums (Be- 
kanntheit bzw. geteiltes Wissen) verknüpfen lassen. Insgesamt handelt es sich 
um sieben Belege des Deiktikums, die mit einem solchen Ausdruck einhergehen, 
plus einen, der mit der Kombination ja bekanntlich kookkurriert. 


(6) PR_Schü2911° 


125 WS und dEswegen habe ich mit äh es pee Ö 
vorsitzendem gusenbauer auch verElINbart, 

126 damit das °h außer STREIT gestellt wIrd, 

127 dass wir über diese frage GUTachten EInholen, 

128 und es ist äh der verfAssungsdienst (.) des 
BUNdes; 

129 > der ja eine °h {wie sie wIssen zwar} nicht 
for!MELL! weisungsfreie behörde ist, 

130 aber de fActo einen ganz besonderen STAtus 
hat innerhalb des bundeskanzleramtes, 

131 KEIN bundeskanzler- 

132 auch ICH nicht, 


3 In diesem Beispiel zeigt sich auch die Persistenz der referentiellen Verwendung der Zeigege- 
ste, da hier die Geste nicht nur die gemeinsame Wissensbasis andeutet, sondern zugleich auch 
die Referenz des Sie deutlich macht. 
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1.33 würd s wAgen oder auch nur verSUchen etwa, 
134 seine perSÖNliche rechtsmeinung (--) dem 
verfassungsdienst äh vOrzugeben; 


Abb. 18: Intersubjektives Deiktikum mit wie Sie wissen 


(7) PR_Schü2504 
081 WS was WICHtig ist bei diesen beiden äh budgEts, 


082 die sozialQUOte bleibt hOch, 

083 > {die ist ja bekAnntlich} bis zum jahr 
zweitausend geSUNken 

084 ist dann lEIcht Angestiegen, 

085 BLEIBT (-) daher hOch, 

086 GANZ wichtig, 


Abb. 19: Zweihändiges intersubjektives Deiktikum mit ja bekanntlich 


Bemerkenswert ist, dass in Beispiel (7) die Geste mit beiden Händen realisiert 
wird, was insgesamt im Korpus nur zehn Mal vorkommt. Alle diese Belege ent- 
stammen den Parlamentsdaten. Ob sich die Zweihändigkeit mit dem oben bereits 
angesprochenen Phänomen der mehreren Angeredeten verknüpfen lässt, muss 
allerdings dahingestellt bleiben. 

Zum Schluss sei noch kurz auf die Verwendung des intersubjektiven Deikti- 
kums ohne lexikalisches Pendant eingegangen. Tatsächlich kookkurrieren 
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knapp die Hälfte der intersubjektiven Zeigegesten im Korpus (46 Belege = 
43,81%) nicht mit einem der oben besprochenen lexikalischen Elemente. Auf- 
grund dieser Beobachtung lässt sich festhalten, dass das intersubjektive Deikti- 
kum tatsächlich selber diese bekanntheits- bzw. einverständnismarkierende 
Funktion hat (und sie nicht etwa nur von den lexikalischen Pendants bekommt) 
und sich dementsprechend mit Recht zu den Gesten mit abtönender Wirkung 
zählen lässt. Zur Verdeutlichung kann auf Beispiel (1) zurückverwiesen werden, 
denn tatsächlich geht mit der ersten Einheit dieses Auszugs auch ein intersubjek- 
tives Deiktikum einher, ohne dass diese Einheit die Partikel ja oder ein anderes 
(zentrales oder peripheres) Element des Clusters 2a (oder ggf. 2b) enthielte.* 


(8) FG_Bla 
411 IN die geraldine chAplin kann ähm herr krüger 
gleich GRÜßen von uns ne, 


412 [am SAMStag; 

413 MK [ja die ( ) 

414 äh am SAMStag, 

415 weil am sAmstag bin ich im in SAlZburg, 
416 bei cArmen NEbel, 

417 IN [da kAnn man gut 

418 MK [wILLkommen bei carmen nEbel, 

419 und da Ist auch geralDINE; 

420 IN im salz {im SALZkammergut [da kann man gut 


lUstig} sein; 


421 MK [ja; 
422 da ma dA kann man gut LUStig sein;= 
423 =beSONders mit (.) der tochter eines der 


größten äh komiker die es so gAb; 


8.2.2.3 Andere Gesten mit der Modalpartikel ja 


Da das intersubjektive Deiktikum nur in gut 10% der Belege von ja nachweisbar 
ist (bzw. in ungefähr einem Viertel der Belege, in denen überhaupt eine abtö- 
nungsliierte Geste realisiert wird - vgl. Abschnitt 8.2.2.1), soll an dieser Stelle ein 
kurzer Blick auf die anderen Belege der Partikel geworfen werden. Die Absicht 
dieses Abschnitts ist nicht, eine vollständige Übersicht aller möglichen Verwen- 
dungskontexte der Partikel (bzw. aller mit ihr kookkurrierenden Gesten) zu lie- 
fern; vielmehr soll diese Besprechung dazu dienen, besser zu verstehen, warum 
die Geste zu ja ‚nur‘ in 26,40% der Belege ein intersubjektives Deiktikum ist. 


4 Für ein gutes Verständnis wird der Auszug hier allerdings mit den vorangehenden Äußerungs- 
einheiten ergänzt. 
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Die Vermutung liegt nahe, dass für die Erklärung dieser niedrigen Belegzahl 
zwei nicht völlig voneinander loszulösende Faktoren zu nennen sind: zum einen 
die Bedeutungsverblassung von ja, zum anderen die Konkurrenz anderer Gesten, 
die mit dieser Partikel einhergehen können. Was die Bedeutungsverblassung von 
ja betrifft, ist an erster Stelle auf die Wichtigkeit der im Abschnitt 10.2 noch näher 
zu besprechenden illokutionstypbezogenen Gesten hinzuweisen (d. h. Gesten, 
die nicht im engeren Sinne abtönen, sondern eher mit der illokutiven Wirkung 
der Partikel zu verknüpfen sind). Tatsächlich sind diese mit insgesamt 101 Bele- 
gen noch stärker vertreten als das intersubjektive Deiktikum. Zwar werden diese 
illokutionstypbezogenen Gesten in 44 der 101 Belege mit einer abtönenden Geste 
kombiniert (23 Mal handelt es sich dabei um ein intersubjektives Deiktikum?), 
aber auch wenn man diese ‚kombinierten‘ Belege außer Betracht lässt, handelt 
es sich um 57 Belege, d. h. 32,02% der 178 Belege von ja+Geste. Bei der Bespre- 
chung der Kombination von Kopfschütteln und einfach wurde die illokutionstyp- 
bezogene Gestik mit dem Phänomen der Kontextverschiebung verknüpft. Auch 
bei kontextverschobenem ja ist nur illokutionstypbezogene Gestik belegt. Aller- 
dings handelt es sich um nur einen einzigen Beleg, sodass die Kontextverschie- 
bung nicht als Erklärung für den großen Anteil der Belege mit einer solchen Geste 
herangezogen werden kann.® 

Wesentlich wichtiger als Erklärung dürfte also die Bedeutungsverblassung 
der Partikel ja sein. Im Abschnitt 2.3.2 wurde bereits erwähnt, dass ja nicht immer 
als reiner Bekanntheitsmarkierer zu interpretieren ist, was u. a. Rinas (2007) dazu 
geführt hat, es als Wahrheitsmarkierer zu bezeichnen. Darüber hinaus wurde die 
Hypothese angesprochen, dass sich ja zu einem reinen Illokutionstypmarkierer 
weiterentwickeln dürfte. Dies dürfte die hohe Frequenz der illokutionstypbezo- 
genen Gesten erklären, denn diese Gesten sind gerade mit der illokutionstypmar- 
kierenden (vielmehr als mit der abtönenden) Wirkung der Partikel zu verknüpfen 
(siehe Abschnitt 10.2 für Beispiele). Dass die Partikel ja so häufig mit einer illoku- 
tionstypbezogenen Geste ohne richtige abtönende Bedeutung einhergeht, dürfte 
also mit dieser weit vorangeschrittenen Bedeutungsverblassung (bzw. gar Gram- 
matikalisierung im Allgemeinen) der Partikel zu verknüpfen sein. 


5 Des Weiteren sind Kombinationen mit Nicken, Kopfschütteln, Beats und sogenannten ‚Palm 
lateral‘-Gesten zu verzeichnen. Auf die beiden letzteren Gesten soll im nächsten Kapitel ausführ- 
licher eingegangen werden. 

6 Sowieso enthält das Korpus nur neun kontextverschobene Belege von ja (=1,89%), d. h. deut- 
lich weniger, als bei einfach der Fall war (9,63%), was im Einklang ist mit der im zweiten Kapitel 
formulierten Hypothese, dass einfach leichter als andere Partikeln der Kontextverschiebung un- 
terliegen könne. 
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Ähnlich sieht es mit dem Auftreten des im vorigen Kapitel besprochenen Ni- 
ckens aus. Diese Geste ist zwar weniger oft belegt als das intersubjektive Zeigen, 
liegt jedoch in den Fernsehdaten nicht weit dahinter zurück, sodass es als ein 
wichtiger Konkurrent der Zeigegeste zu betrachten ist. Im vorigen Kapitel wurde 
bereits darauf hingewiesen, dass das abtönende Nicken andeutet, dass der Spre- 
cher zu seiner Aussage steht bzw. sie für wahr hält. Dies impliziert allerdings 
nicht unbedingt, dass er damit auf gemeinsames Wissen bzw. auf Einverständnis 
hinweist, was oben als die zentrale Bedeutung des intersubjektiven Deiktikums 
(mit Assertionen) angegeben wurde. In dieser Hinsicht ist das Nicken auch etwas 
weniger spezifisch als das Deiktikum, was es auch besser geeignet macht für die 
Verwendung in weiter verblassten Fällen von ja, in denen die Bekanntheitsnu- 
ance nicht so prominent anwesend ist. 

Das soll aber nicht heißen, dass die illokutionstypbezogenen Gesten und das 
Nicken nicht auch in solchen Fällen eingesetzt werden könnten, in denen durch- 
aus eine deutliche Bekanntheitsbedeutung nachweisbar ist. Tatsächlich ist es 
durchaus möglich, dass die Geste nur einen Teil der Bedeutung des lexikalischen 
Pendants vermittelt (vgl. Abschnitt 11.1.2). Dementsprechend sind die illokuti- 
onstypbezogenen Gesten und das Nicken nicht auf die verblassteren Fälle be- 
schränkt, was deren Frequenz im Vergleich zum intersubjektiven Deiktikum 
noch weiter erhöht. Es ist nicht ausgeschlossen, dass auch das intersubjektive 
Deiktikum noch einer weiteren Bedeutungsverblassung unterliegt und sich 
dadurch immer besser für diejenigen Fälle eignet, in denen die Bekanntheitsbe- 
deutung nicht so deutlich nachweisbar ist, aber derzeit scheint es doch vor allem 
mit denjenigen Fällen zu kookkurrieren, in denen eine deutliche Bekanntheits- 
nuance vorhanden ist. 

Eine deutliche Eins-zu-eins-Korrelation von Gestentyp und Kontext scheint 
also nicht zu bestehen, obwohl durchaus einige Tendenzen durchschimmern (in- 
tersubjektives Deiktikum eher in Kontexten mit richtiger Bekanntheit, Nicken 
eher in Wahrheitskontexten und in den Fällen mit der am stärksten verblassten 
Bedeutung hauptsächlich illokutionstypbezogene Gesten). Weitere Erforschung 
ist hier allerdings noch notwendig. Auffällig ist in dieser Hinsicht jedenfalls, dass 
im Korpus das intersubjektive Deiktikum und das Nicken nicht miteinander kom- 
biniert werden. Auf jeden Fall ist im Rahmen der vorliegenden Arbeit festzuhal- 
ten, dass die beachtliche Häufigkeit der illokutionstypbezogenen Gestik einiger- 
maßen die Niedrigkeit der Frequenz des intersubjektiven Deiktikums relativiert, 
aber trotz dieser niedrigeren Frequenz bleibt das Deiktikum nach wie vor die 
wichtigste abtönende Geste in Kombination mit ja. 
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8.2.3 Timing des Deiktikums 


Bei der Besprechung des Timings des abtönenden Kopfschüttelns wurde bereits 
auf McNeills (1992) Synchronieregeln hingewiesen. Etwas unnuanciert ließen 
sich diese Regeln folgendermaßen zusammenfassen: Gesten tendieren dazu, mit 
ihrem lexikalischen Pendant oder mit dem hauptbetonten Element der verbalen 
Äußerung zu überlappen. Diese Tendenzen können durchaus zusammenfallen, 
wenn das lexikalische Pendant das hauptbetonte Element ist. Allerdings ist dies 
bei Modalpartikeln eher unwahrscheinlich, da Modalpartikeln normalerweise 
unbetont sind. Trotzdem wurde im vorigen Kapitel für das Kopfschütteln gezeigt, 
dass aufgrund der Dauer der Geste meist doch die beiden Tendenzen zutreffen. 

Allerdings lassen sich die Ergebnisse für das Kopfschütteln nicht ohne Wei- 
teres auf das intersubjektive Deiktikum ausdehnen. Nicht nur wäre das methodo- 
logisch ungerechtfertigt; es ist auch dem Umstand Rechnung zu tragen, dass 
beim intersubjektiven Deiktikum im Normalfall durchaus eine Einteilung in Pha- 
sen (Vorbereitung, Stroke und Rückzug) möglich ist, während das für das Kopf- 
schütteln erheblich schwieriger ist (vgl. Abschnitt 6.2.2). Trotzdem lassen sich 
vom Timing her zwischen dem abtönenden Kopfschütteln und dem intersubjek- 
tiven Deiktikum beachtliche Übereinstimmungen nachweisen. 

Als Ausgangspunkt sei daran erinnert, dass McNeills Synchronieregeln im 
Grunde genommen für den Stroke der Geste gelten. Wenn man sich den Stroke 
des intersubjektiven Deiktikums in den Belegen mit ja anschaut, so fällt auf, dass 
dessen Timing meist mit den Synchronieregeln im Einklang ist. Tatsächlich wird 
der Stroke im Allgemeinen (41 von 47 Belegen = 87,23%) entweder zeitgleich mit 
der Modalpartikel oder zeitgleich mit der hauptbetonten Silbe realisiert, je nach- 
dem, welche von den beiden als erste ausgesprochen wird. Der Stroke der Geste 
fällt also mit der Modalpartikel zusammen, es sei denn, dass die hauptbetonte 
Silbe der Partikel vorausgeht: In dem Fall fällt der Stroke mit dem Hauptton zu- 
sammen.’ Abweichungen von dieser Tendenz gibt es im Korpus nur sechs: Zwei- 
mal (u. a. im unten noch zu besprechenden Beispiel (9)) wird der Stroke der Geste 
erst mit dem Hauptton realisiert, obwohl die Modalpartikel dieser hauptbetonten 
Silbe vorangeht, einmal (in Beispiel (1)) fällt der Stroke zwischen der Partikel und 
dem Hauptton, und dreimal wird der Stroke am Anfang der Einheit realisiert, d. h. 
vor der Modalpartikel und dem Hauptton. In den beiden ersteren Fällen ist der 


7 Das Zusammenfallen mit dem Hauptton ist damit zu verbinden, dass das hauptbetonte Ele- 
ment im Allgemeinen das wichtigste Element des Skopus der Partikel bzw. der Geste ist. Die 
Überlappung der Geste mit dem Hauptton sagt also mehr aus über den Skopus der Abtönung als 
über die eigentliche abtönende Bedeutung. 
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Grund in der Interferenz mit einer vorangehenden Geste zu sehen; im letzteren 
Fall ist kein solcher Faktor nachzuweisen, aber vielleicht liegt hier auch eine Art 
projizierende Wirkung vor, wie sie im vorigen Kapitel für das Kopfschütteln be- 
schrieben wurde. 

Was die Dauer der Geste angeht, wurde im vorigen Kapitel - unter Verweis 
auf Harrisons (2010) Studie zu den Handgesten der Negation im Englischen - auf 
den Skopus der Abtönung Bezug genommen. Harrison hat gezeigt, dass der 
Stroke dieser Gesten dazu tendiert, mit dem lexikalischen Pendant (d. h. mit der 
verbalen Negation) zusammenzufallen, während der Hold ein Indiz des Skopus 
der Negation ist. Völlig identisch ist die Situation im Falle des intersubjektiven 
Deiktikums nicht, da der Stroke dieser Geste nicht immer mit der Partikel ja rea- 
lisiert wird, aber trotzdem scheint auch in diesem Fall eine Beziehung zwischen 
Dauer und Skopus zu bestehen. Tatsächlich ist in 31 Belegen (= 65,96%) ein deut- 
liches Halten (Hold) des Deiktikums vor dem Rückzug wahrzunehmen, und in 
den meisten dieser Fälle dauert dieser Hold (fast) bis zum Ende der Intonations- 
einheit an, d. h. so lange, dass der Rückzug der Hand in die Ruheposition nicht 
vor dem Ende der Einheit beendet wird.? Die Daten legen also nahe, dass auch 
beim intersubjektiven Deiktikum eine Beziehung zwischen Dauer und Skopus 
anzusetzen ist. 


8.3 Intersubjektive und referentielle Zeigegesten 


Im Laufe dieser Besprechung des intersubjektiven Deiktikums wurde bereits da- 
rauf hingewiesen, dass diese Geste zwar nicht primär referentiell ist, allerdings 
insofern als referentiell betrachtet werden kann, als sie die Person indiziert, mit 
der Einverständnis gesucht wird. Zum Abschluss dieser Fallstudie zum intersub- 
jektiven Deiktikum scheint es also angebracht, noch kurz auf dessen Beziehung 
zu bzw. Interaktion mit dem referentiellen Deiktikum einzugehen.’ 

Obwohl am Anfang dieses Kapitels angedeutet wurde, dass sich kein Eins- 
zu-eins-Verhältnis zwischen Form und Funktion der Zeigegesten nachweisen 
lässt, zeichnet sich doch eine Tendenz ab. Ist bei den intersubjektiven Deiktika 
das Fingerzeigen mit 4,76% (5 von 105 Belegen) eher der Ausnahmefall, so macht 
es bei den referentiellen Deiktika gut ein Drittel der Belege aus (205 Belege von 


8 Auch bei den Belegen des intersubjektiven Deiktikums ohne lexikalisches Pendant ist ein sol- 
cher Hold in 32 von 46 Belegen (69,57%) wahrzunehmen. 

9 Der Einfachheit halber wird nicht zwischen konkreten und abstrakten referentiellen Deiktika 
(d. h. Deiktika mit und ohne sichtbare Referenz) unterschieden. 
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596 = 34,40%). Die flache Hand ist annähernd gleich häufig belegt (217 Belege = 
36,41%), während die Schüsselhand, die beim intersubjektiven Deiktikum die 
meistbelegte Handform darstellt, wesentlich seltener ist (106 Belege = 17,79%). 
Auffällig ist, dass ein beachtlicher Unterschied zwischen den Fernsehdaten und 
den Parlamentsdaten besteht (vgl. Tabelle 6): In den Fernsehdaten dominiert das 
Fingerzeigen als Form des referentiellen Deiktikums, während in den Parla- 
mentsdaten die flache Hand die häufigste Form ist. Ein wichtiger Teil der Erklä- 
rung dürfte in der oben bereits erwähnten Beobachtung Müllers (1996) liegen, 
dass das Zeigen auf Personen aus Höflichkeitsgründen meist kein Fingerzeigen 
ist. Tatsächlich wird im Korpus bis auf wenige Ausnahmen das Fingerzeigen zum 
Andeuten einer Person nur in heftigeren Debatten verwendet (sei es in den Talk- 
shows oder im Parlament), in denen eine Person direkt ‚angegriffen‘ wird; an- 
sonsten wird tatsächlich eine offene Hand verwendet. Es stellt sich aber heraus, 
dass in den Fernsehdaten meist auf Objekte gezeigt wird, während in den Parla- 
mentsdaten häufiger Personen das Ziel der Zeigegeste sind. Da es unhöflich bzw. 
offensiv wirkt, Personen mit dem Fingerzeigen anzudeuten, während das für Ob- 
jekte kein Problem ist, liegt hier vermutlich die Erklärung für den Unterschied 
zwischen den Fernsehdaten und den Parlamentsdaten. 


Tab. 6: Distribution der Handformen bei den Zeigegesten; die dominante Handform ist jeweils 
grau hinterlegt 


referentiell intersubjektiv 
gesamt Fernsehen Parlament gesamt Fernsehen Parlament 
Fingerzeigen 34,40% 46,46% 22,40% 4,76% 9,26% 0,00% 


flache Hand 36,41% 21,55% 51,17% 29,52% 25,93% 35,29% 
Schüsselhand 17,79% 17,85% 17,73% 59,05% 53,70% 64,71% 
andere Form 11,40% 14,14% 8,70% 6,67% 11,11% 0,00% 


Es stellt sich also heraus, dass der Unterschied zwischen referentiellem und 
intersubjektivem Zeigen nicht mit der Distribution des Zeigens mit einem Finger 
versus mit geöffneter Hand übereinstimmt - obwohl das Fingerzeigen durchaus 
häufiger referentiell verwendet wird. Wichtiger ist der Unterschied zwischen den 
offenen Handformen: Die referentielle Zeigegeste hat häufiger die angespanntere 
flache Hand, während das intersubjektive Zeigen häufiger mit der lockereren 
Schüsselhand realisiert wird. 
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Interessant ist diese Distribution besonders im Hinblick auf die Frage, wie es 
mit der Kombinierbarkeit von referentiellem und intersubjektivem Zeigen aus- 
sieht. Dass das intersubjektive Deiktikum insofern referentiell ist, als es die Per- 
son andeutet, mit der Einverständnis gesucht wird, wurde oben bereits erwähnt. 
Allerdings wurde bei der Besprechung von Beispiel (6) suggeriert, dass die refe- 
rentielle Komponente durchaus auch etwas stärker sein kann, wenn sie zugleich 
die Referenz eines Pronomens in der zweiten Person andeutet. Im Korpus sind 
neun solche Fälle enthalten, in denen die Zeigegeste zugleich referentiell und in- 
tersubjektiv zu interpretieren sein dürfte. Es soll nicht wundern, dass in diesen 
Fällen immer mit einer offenen Hand gezeigt wird, da das die Standardform des 
Zeigens auf Personen zu sein scheint. Wichtiger ist die Beobachtung, dass in die- 
sen ‚ambigen‘ Fällen sechsmal mit der Schüsselhand und dreimal mit der flachen 
Hand gezeigt wird. Ein eindeutiger Unterschied zwischen referentiellem und in- 
tersubjektivem Deiktikum lässt sich also aufgrund der Handform nicht machen, 
aber es scheint durchaus so zu sein, dass referentielle Zeigegesten häufiger mit 
der flachen Hand, intersubjektive dagegen eher mit der Schüsselhand realisiert 
werden. 


8.4 Fazit 


Das intersubjektive Deiktikum unterscheidet sich in mehreren Hinsichten von 
den Kopfgesten (Nicken, Kopfschütteln), die im vorigen Kapitel analysiert wur- 
den. Nicht nur handelt es sich um eine Handsgeste statt einer Kopfgeste, es lässt 
sich auch deutlicher in die klassischen Gestenphasen (Vorbereitung, Stroke und 
Rückzug) aufteilen. Trotzdem konnte in dieser zweiten Fallstudie gezeigt werden, 
dass sich aus der Sicht der Abtönung beachtliche Übereinstimmungen zwischen 
dem intersubjektiven Deiktikum und dem abtönenden Kopfschütteln nachwei- 
sen lassen. Es handelt sich zum Beispiel in den beiden Fällen um die ‚abge- 
schwächte‘ Variante einer ziemlich stark konventionalisierten Geste - die Ab- 
schwächung zeigt sich in diesem Fall, anders als beim Kopfschütteln, jedoch 
nicht in einer subtileren Realisierung, sondern darin, dass das intersubjektive 
Deiktikum meist mit der lockereren Schüsselhand und nicht mit der gespannte- 
ren flachen Hand realisiert wird. Auch im Hinblick auf das Timing zeigt sich eine 
Übereinstimmung, denn obwohl die Tendenzen auf dieser Ebene etwas unter- 
schiedlich sind (was zum Teil auf die gerade erwähnte deutlichere Phasierung in 
Vorbereitung, Stroke und Rückzug zurückzuführen ist), spielt ähnlich wie beim 
Kopfschütteln auch beim intersubjektiven Deiktikum der Skopus eine wichtige 
Rolle für die Dauer der Geste. Inwiefern es sich bei diesen Übereinstimmungen 
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zwischen dem intersubjektiven Deiktikum und dem Kopfschütteln um allge- 
meine Konstanten der abtönenden Gesten handelt, soll in den folgenden Kapiteln 
weiter geklärt werden. 


9 Weitere abtönende Gesten 


9.0 Einführung 


Außer den in den beiden vorigen Kapiteln besprochenen Gesten (Kopfschütteln, 
Nicken und das intersubjektive Deiktikum) sind in den Korpora noch weitere ab- 
tönende Gesten vorzufinden, die mit den untersuchten Modalpartikeln kookkur- 
rieren. Im Rahmen der vorliegenden Arbeit ist es jedoch nicht möglich, alle diese 
Gesten ins Detail zu besprechen - aus Platzgründen, aber auch, weil die verblei- 
benden Gesten entweder für eine detaillierte Analyse zu wenig Belege aufweisen 
(9.2-4) oder aber so allgemein sind, dass eine eingehende Studie den Rahmen der 
Arbeit sprengen würde (Beats, 9.1). 

Trotzdem erscheint es wertvoll, im Hinblick auf die allgemeine Diskussion in 
den folgenden Kapiteln diese Gesten in die Analyse einzubeziehen. Daher soll in 
diesem Kapitel kurz darauf eingegangen werden. Besprochen werden, der Rei- 
henfolge nach, Taktstockgesten (9.1), das Achselzucken (9.2), ‚palm lateral‘ und 
‚horizontal palm‘ (9.3), und die Börsenhand (,Mano a borsa‘) und der ‚senkrechte 
Ring‘ (9.4). Abgeschlossen wird das Kapitel mit der Frage, ob sich bei diesen 
Gestikmustern sogenannte Kinaestheme nachweisen lassen, d. h. Übereinstim- 
mungen in der Form, die auf funktionale Ähnlichkeiten schließen lassen (9.5). 


9.1 Taktstockgesten 


Das erste in diesem Kapitel zu besprechende Gestikmuster wurde im dritten Ka- 
pitel bereits als eine von McNeills Gestikdimensionen aufgelistet: die Beats bzw. 
Taktstockgesten. Dabei wurde dieser Gestentyp als eine (mehr oder weniger) dem 
Sprechrhythmus folgende Hin-und-her-Bewegung eines Körperteils definiert. Ty- 
pischerweise handelt es sich um eine Auf-und-ab-Bewegung der Hand (bzw. der 
Hände), aber auch Bewegungen anderer Köperteile (typischerweise des Kopfes) 
und zum Teil in anderen Dimensionen sind möglich. Im Allgemeinen wird die 
Bewegung nach unten (der ‚Downbeat‘) als der Stroke bzw. die bedeutungstra- 
sende Komponente der Beatgeste verstanden, und die Anmerkung, dass die 
Geste dem Sprechrhythmus folgt, ist so zu verstehen, dass die Downbeats viel- 
fach mit den betonten Silben zusammenfallen (obwohl sich Abweichungen von 
dieser Tendenz finden lassen, die allerdings nicht unbedingt den rhythmischen 
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Aufbau der Geste an sich durchbrechen; vgl. McClave (1994) für eine eingehen- 
dere Besprechung). 

In Kapitel 6 wurde bei der Erläuterung der Prinzipien zur Zählung der Gesten 
bereits ein Beispiel eines Beats geliefert; dieses Beispiel sei hier nochmals aufge- 
nommen, diesmal jedoch mit einer Abbildung, die den Anfang der Beatbewegung 
bei einer Einheit (in diesem Fall Einheit 398) zeigen soll und nicht die Verände- 
rung der Handform über die Einheiten hinweg (s. Abbildung 8a). 


(1) PR_West2504' 


398 PW {es Ist (-) schlicht und einfach INakzeptabel;} 

399 dass {ein uu Es-amerikanischer FONDS, } 

400 und eine uu Es-amerikanische reGlIErung, } 

401 hIEr uns in ÖSter}reich; 

402 einer in Österreich befindlichen bank in 
österreichischem beSITZ, } 

403 VOR}schreibt- 

404 wEr kunde sein darf und wer NICHT.} 


Abb. 20: Beat (Bewegungen nach unten zu schlicht und einfach) 


In diesem Beispiel ist der Beat tatsächlich als eine Auf-und-ab-Bewegung ein- 
zustufen. Allerdings sind nicht alle Beats (nur) auf dieser senkrechten Dimension 
anzusiedeln. Kendon (2004: 231) hat zum Beispiel darauf hingewiesen, dass die 
Beatbewegung, die typischerweise in der Börsenhand enthalten ist (vgl. Ab- 
schnitt 9.4), durchaus auch auf der waagerechten Dimension (auf den Sprecher 
zu/vom Sprecher weg) anzusiedeln sein kann. Ähnlich ist auch im nachstehen- 
den Beispiel die Bewegung nicht als rein senkrecht einzustufen. Das Beispiel ent- 
stammt einer der legendären Diskussionen zwischen Götz George und Thomas 


1 Bei Beatsequenzen, die sich über mehrere Intonationseinheiten hinweg erstrecken, erscheint 
die spitze Klammer ( > ) jeweils bei der Einheit, zu der die Abbildung passt. Da Beats von sich 
aus vielfach iterativ sind, wurde in den Transkripten nicht jeder einzelne Stroke (bzw. Down- 
beat) separat unterstrichen, sondern die Unterstreichung läuft jeweils vom ersten bis zum letz- 
ten Stroke der Strokephrase. 
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Gottschalk über den intellektuellen Wert bestimmter schauspielerischer Stoffe im 
Vergleich zu einer Unterhaltungssendung wie Wetten, dass..? (der das Beispiel 
entnommen wurde). Es ist durchaus eine Bewegung auf der senkrechten Achse 
wahrzunehmen, aber die Abbildung zeigt, dass es sich nicht um eine rein senk- 
rechte Bewegung handelt, sondern vielmehr um eine diagonale Bewegung, bei 
der die Hand von links oben nach rechts unten (aus der Sicht des Sprechers) be- 
wegt wird. 


(2) FG_AFvid3 
022 GG entSCHULdige mal, 


023 ich SITZ halt eben nicht vierzig jahre lang 
auf einer cOUch, 

024 TG (aber) jetzt jetzt 

025 GG und NERve lEUte, 

026 TG jetzt KOMMT er, 

027 es ist 

028 also {ich HAbe gesAgt;} 

029 {DIESmal, } 

030 {oKAY-} 

031 > lAss es {uns NOCHmal versuchen, } 

032 wir haben {ja schon EInmal uns 
MISSverstand}en; 

033 {es KANN nicht sEIn; (.)} 

034 {dass dU hier zwar als Ernster schauspieler 


aber trOtzdem immer die STIMmung vermiest, } 


Abb. 21: Diagonaler Beat 


Die Abbildung zeigt, dass Gottschalk in diesem Auszug nicht nur einen 
Handbeat realisiert, sondern zugleich auch den Kopf auf und ab bewegt. Dies ist 
nicht verwunderlich, da u. a. Paggio (2012: 286) bereits darauf hingewiesen hat, 
dass Beats auch mit dem Kopf realisiert werden können. Dies ist tatsächlich auch 
in den Korpusdaten belegt. Ein wichtiger Unterschied zwischen Kopfbeats und 
Handbeats ist allerdings, dass die Kopfbeats im Korpus meist einfache Beats sind, 
d. h. Beatgesten, die nur aus einem Downbeat (typischerweise zur hauptbetonten 
Silbe der Intonationseinheit) bestehen und keine rhythmische Iteration aufwei- 
sen, wie in (3), während die Handbeats typischerweise iteriert sind. 
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3) FG_B1b 
187 AS und äh diese hundert euro werden 
AUsnahmsweise mal NICHT angerechnet; 
188 IN mhm; 
189 kIndergeld ja AUCH nicht oder, 
190 AS doch DOCH, 
191 also KINdergeld wird Angerechnet, 
192 die hUnderdvierundsechzig euro KINdergeld- 
193 °h die werden äh von den äh rEgelleistungen 


also von diesen zweihundertelf euro 
beziehungsweise zweihunderteinundachtzig 
euro ABgezogen; 

194 IN mhm- 

195 AS also die werden NICHT obendrAUf gegeben, 


196 es wIrd manchmal so beHAUPtet, 

197 sogar frau !MER!kel hat es schon mal gesAgt, 
198 aber dAs (.) ist [einfach nicht WAHR, 

199 IN [JA, 

199 AS zweihundertElf zweihundertEINundachtzig euro; 
200 > {INklusiv} (.) des kIndergeldes. 


f ò 


Abb. 22: Kopfbeat 


In ihrer Besprechung von Kopfbeats gibt Paggio (2012: 287) an, dass das Ni- 
cken dementsprechend sowohl symbolisch (damit ist die emblematische Ver- 
wendung gemeint) als auch als Beat zu interpretieren sein kann. Es ist jedoch 
m. E. irreführend, Kopfbeats auch als Nicken zu bezeichnen, da es sich um funk- 
tional deutlich unterschiedliche Gesten handelt. Allerdings ist dieser Unter- 
schied aufgrund der formalen Ähnlichkeit besonders im Falle iterativer Beats 
nicht immer deutlich zu machen. Ein Indiz könnte der Rhythmus der Geste sein: 
Das Nicken hat seinen eigenen Rhythmus, während der Beat meist dem Sprechr- 
hythmus folgt. Zudem ist das Nicken eine fließende Bewegung, die als Ganzes die 
Bedeutung vermittelt, während beim Beat die Bewegung nach unten (d. h. der 
Downbeat) als bedeutungstragende Komponente im Allgemeinen stärker und 
energischer ist als die Bewegung nach oben - was sich auch darin zeigt, dass ein 
Hold beim Beat im Normalfall dem Downbeat folgt (ein Anhalten beim Nicken 
würde nicht als Hold, sondern vielmehr als das Ende der Geste interpretiert). 
Trotzdem ist die Grenze zwischen Nicken und Kopfbeats ausgehend von der Form 
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nicht immer klar zu ziehen, sodass Faktoren wie die Bedeutung der verbalen Äu- 
Berung und die Intonation herangezogen werden müssen. 

Diese Abgrenzungsschwierigkeit ist allerdings nicht der Hauptgrund, warum 
an dieser Stelle keine detaillierte Analyse der Beats vorgenommen wird. Anders 
als bei den im weiteren Verlauf dieses Kapitels noch zu besprechenden Gesten ist 
dies auch nicht auf einen Mangel an Belegen im Korpus zurückzuführen. Ganz 
im Gegenteil: Mit nicht weniger als 1319 Belegen ist der Beat im Korpus die am 
häufigsten verwendete Geste. Vielmehr hat es mit der allgemeinen Funktion des 
Beats zu tun. Wie bereits im dritten Kapitel angedeutet wurde, dienen Beats der 
Hervorhebung bzw. Verstärkung desjenigen, mit dem sie gemeinsam eingesetzt 
werden (d. h. der Äußerung, die sie begleiten, und/oder der Geste, mit der sie 
kombiniert werden). In Bezug auf die verbale Äußerung heißt das also, dass Beats 
dazu dienen, Argumenten Nachdruck zu verleihen oder die Illokution zu verstär- 
ken. In der Hinsicht ähnelt die Funktion des Beats der Funktion von Partikeln wie 
doch und eben, aber auch u. a. bloß und nur, die nicht den in vorliegender Arbeit 
zentral stehenden Partikelclustern angehören. Allgemeiner ließe sich mit Alibali/ 
Heath/Myers (2001: 184) festhalten, dass es sich bei den Beats um eine „functio- 
nally heterogeneous category“ handelt, sodass eine detaillierte Analyse der Beat- 
gesten den Skopus der vorliegenden Arbeit übersteigen würde. 


9.2 Achselzucken 


Auf die zweite Geste, die in diesem Kapitel kurz anzusprechen ist, wurde oben im 
Rahmen der Fallstudie zum Kopfschütteln bereits hingewiesen: das Achselzu- 
cken (oder Schulterheben). In der Analyse des Kopfschüttelns wurde auf das 
Emblem des Nichtwissens - den Shrug - verwiesen, der eigentlich ein Amalgam 
unterschiedlicher Gesten ist (vgl. Abschnitt 11.1.3), darunter auch das Achselzu- 
cken. Obwohl der Shrug als Ganzes in der Literatur schon einige Male besprochen 
wurde (s. u. a. Bavelas et al. 1992 und Streeck 2009), sind Arbeiten zum Achsel- 
zucken an sich bislang eher selten. Tatsächlich kann das Achselzucken aber auch 
alleine verwendet werden, wie im nachstehenden Beispiel: 


(4) FG_A3b 
879 ME es ist SO, 
880 ich bin selber dreimal schon VIERte bei 
großveranstaltungen geworden, = 
881 =und es gibt NIX bIttereres; 
882 also °h wEnn man dann fünfte sechste oder 


ZEHNte wird,= 


Achselzucken — 161 


883 =dann kAnn man das irgendwie noch 
akzepTIEren;= 

884 > =aber der vlIErte platz der {TUT einfach 
weh; (.)} 


Interessant ist, dass in diesem Fall das Achselzucken mit der Partikel einfach 
kookkurriert. Das ist keine Ausnahme: Bei insgesamt 18 Belegen von einfach ist 
ein Achselzucken (in Kombination mit anderen Elementen des Shrugs oder al- 
leine) nachweisbar.” Zugleich ist durch diese Verbindung des Achselzuckens so- 
wohl mit dem Shrug als auch mit der Partikel einfach zugleich auch eine Bezie- 
hung zwischen dem Achselzucken und dem Kopfschütteln anzusetzen. Tatsäch- 
lich werden diese beiden Gesten im Korpus 31 Mal zusammen eingesetzt (davon 
9 Mal in Kombination mit der Partikel einfach). 

Aus dieser engen Vernetztheit des Achselzuckens mit dem Shrug, dem Kopf- 
schütteln und der Partikel einfach lassen sich auch Angaben zur Bedeutung des 
Achselzuckens ableiten. Es sieht tatsächlich danach aus, dass die Bedeutung des 
Achselzuckens jener der Partikel einfach und des Kopfschüttelns ähnelt. So mar- 
kiert in Beispiel (4) sowohl das Achselzucken als auch die Partikel einfach die 
Behauptung, vierte zu werden sei eine unangenehme Erfahrung, als nicht zur 
Diskussion stehend: So ist es, mehr ist nicht dazu zu sagen. Ähnlich ist in Beispiel 
(5) dem Achselzucken die Bedeutung der subjektiven Evidenz zuzuschreiben, die 
für Beurteilungen mit einfach typisch ist: Dass so ein positives Ergebnis der gan- 
zen Mannschaft Schwung gibt, ist SF zufolge einfach herrlich (die Rede ist vom 
Biathlon-Weltcup-Rennen, das Christoph Stephan gewonnen hat, vgl. Beispiel (1) 
in Kapitel 7). In Beispiel (6) dagegen markiert das Achselzucken eher, dass der 
angesprochene Sachverhalt auf der Hand liegt: Wenn bei einem Schiflugwettbe- 
werb der Aufwind zunimmt und man dadurch die Flugweiten nicht mehr in den 
Griff bekommen kann (und dementsprechend die Sicherheit der Athleten nicht 
mehr gewährleisten kann), braucht man gar nicht darüber nachzudenken, was 
zu tun ist, denn da liegt es auf der Hand, dass man die Anlauflänge verkürzt (so- 
dass der Wind weniger Einfluss auf die Flugweite hat) und neu anfängt, vielmehr 
als auf wechselnde Windverhältnisse zu hoffen, die einen fairen Wettkampfab- 
lauf unmöglich machen (wie es hier geschehen ist). In Beispiel (7) schließlich, in 
dem das Achselzucken mit der Partikel halt einhergeht, ist die Geste (wie auch 
die Partikel) zu interpretieren als ‚mehr ist nicht dazu zu sagen‘ bzw. ‚damit ist 


2 Damit handelt es sich um 13,33% der 135 ‚sichtbaren‘ Belege von einfach bzw. 29,03% der 62 
Belege von einfach mit einer abtönungsliierten Geste, und um 10,98% der 164 Belege des Ach- 
selzuckens. 
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das Thema für mich erledigt‘: Es ist natürlich unangenehm, wenn ein Zug infolge 
eines Bahnstreiks ausfällt, aber man kann es nicht ändern, es ist einfach Pech. 


(5) FG_AIb 


1466 
1467 


1468 
1469 


SF 


MA 


(N) FG_Bla 


x01 


x02 


x03 


x04 


SI 


also die VIER (.) die heute gelAUfen sind, 
gehen natürlich POsitiv in das (.) die 
wEltmeisterschaften; 
und DAS ist eben (--) ausschlaggEbend, 

und christoph stephan hat eben °h in den in 
den trAIningstagen auch vIEl viel der 
mannschaft geGEben- 

weil er auch einer ist der manchmal wIrklich 
da sei seine sache DURCHzieht, 

AUch im LAUfen, 

und das gIbt der ganzen mannschaft SCHWUNG; 
{HERRlich.} 


aber hAben sie auch so en bisschen 
verSTÄNDnis für die jury, 

dass die auch nach so nem schAnzenrekord 
erst mal en moMENT sagt, 

lass uns mal berAten was wir jetzt MAchen 
sollen, 

ja es gEht nicht um s beRAten, 


aber °h wenn jemand (.) zwEI FÜNFzehn 
springt, 
ähm (.) und man wartet aufgrund (.) ähm weil 


man Angst hat dass es zu WEIT geht, 

dann {muss man zwei luken} RUNtergehen und 
den durchgang noch einmal neu stArten, 

zur nOt macht man halt nur EINn durchgang, 
aber (--) es kann net SEIN dass man beim 
harri olli sAgt- 

oKAY, 

den lAss mer bei aufwind RUNterspringen- 
und beim NÄCHsten ähm sagt man nEE; 
da wArte mer lieber bis die bedingungen e 
bissel SCHLECHter werden; 


bei den äh divErsen BAHNgewerkschaften die 
es hier so gibt, 
da blickt man ja schon nicht mehr dUrch wer 
hier WANN streikt, 

ähm es sind (.) mit sIcherheit irgendwo 
beRECHtigte anliegen, 

äh die die LEUte haben; 
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x05 und ähm (-) JA. 
x06 > {PECH gehabt halt.} 


Die gerade gelieferten Bedeutungsbeschreibungen erinnern an jene, die in 
den Abschnitten 2.3.3 und 7.2.1 für die Partikel einfach (bzw. für den Cluster 2b 
im Allgemeinen) wie für das abtönende Kopfschütteln geliefert wurden. Für das 
Achselzucken ist also eine Wirkung anzusetzen, die jener des abtönenden Kopf- 
schüttelns bzw. der Partikeln des Clusters 2b ähnelt, was auch zu seiner Rolle als 
zentrales Element des Shrugs passt. Eine potenzielle Paraphrase wäre dann zum 
Beispiel ‚ich weiß nicht, was noch mehr dazu zu sagen wäre‘. Dies passt auch zur 
folgenden Beschreibung von Debras/Cienki (2012: 936; Hervorhebungen im Ori- 
ginal), die Begriffe wie evident (‚obvious‘) und für sich selbst sprechend (‚self-ex- 
planatory‘) verwenden: 


In some cases, speakers shrug to convey the obviousness of a state of affairs, based on facts 
observable by everyone, or general knowledge and doxic beliefs [...]. This sense of obvious- 
ness can also stem from the context of interaction itself, e.g. when gesturers implicitly refer 
to knowledge they share as friends |...], or show that the gesturer’s positioning is so obvious 
and self-explanatory that it doesn’t even need to be stated [...]. Finally, the third epistemic- 
evidential use of shrugs is related to a logical or chronological necessity beyond the ges- 
turer’s responsibility |...]. 


Aufgrund dieser Kompatibilität mit der zentralen Bedeutung des Clusters 2b 
ist es nicht verwunderlich, dass das Achselzucken auch mit den drei zentralen 
Partikeln dieses Clusters vorkommen kann (s. u. a. Beispiele (4) und (7)). In der 
nachstehenden Tabelle wird die relative Frequenz des Achselzuckens mit diesen 
drei Partikeln geliefert. Erneut bestätigt sich die Beobachtung, dass es sich bei 
halt und eben nicht um reine Synonyme zu handeln scheint, aber zugleich sind 
die Zahlen im Einklang mit der im 7. Kapitel gemachten Anmerkung, dass die 
Annahme eines Kontinuums einfach - halt - eben auch nicht ganz der Wirklich- 
keit entsprechen dürfte, da einfach von der Häufigkeit des Achselzuckens her 
zwischen den beiden anderen Partikeln anzusiedeln ist.’ 


3 Das Bild ist allerdings nicht so einheitlich, wie es die Angaben in der Tabelle suggerieren. Aus 
der Sicht der Geste nämlich ist einfach mit 18 Belegen die am stärksten vertretene Partikel, vor 
halt mit 12 Belegen und eben mit nur 2 Belegen. Inwiefern es dabei eine Rolle spielt, dass das 
Achselzucken - ähnlich wie einfach (und das Kopfschütteln) - vor allem in den Fernsehdaten 
belegt ist, muss an dieser Stelle dahingestellt bleiben. 


164 —— Weitere abtönende Gesten 


Tab. 7: Achselzucken bei den zentralen Partikeln des Clusters 2b 


einfach halt eben 


13,33% 18,46% 3,23% der sichtbaren Partikelbelege 


29,03% 50,00% 7,14% der sichtbaren Partikelbelege mit einer Geste 


Wenn man sich die Frequenzen in Tabelle 7 anschaut, so fällt auf, dass das 
Achselzucken besonders bei halt eine nicht zu vernachlässigende Rolle spielt: In 
der Hälfte der Fälle, in denen mit dieser Partikel eine Geste einhergeht, ist diese 
Geste ein Achselzucken (ggf. in Kombination mit einer anderen Gestikkompo- 
nente, etwa einem Kopfschütteln). Trotzdem wird an dieser Stelle keine so detail- 
lierte Analyse der Kombination halt+Achselzucken vorgenommen, wie dasin Ka- 
pitel 7 für die Kombination einfach+Kopfschütteln gemacht wurde, weil die 
absolute Zahl der Belege dafür zu niedrig ist: Es handelt sich nur um 12 Belege. 
Insgesamt scheint das Achselzucken nicht häufig mit einer Modalpartikel kom- 
biniert zu werden: Es ist im Korpus 164 Mal belegt, was im Vergleich zu anderen 
abtönenden Gesten durchaus eine beachtliche Zahl ist, aber nur in 38 Belegen ist 
eine Modalpartikel vorhanden. Dies ist ein weiterer Grund, das Achselzucken in 
vorliegender Arbeit, in der die Modalpartikeln als Ausgangspunkt zentral stehen, 
nicht eingehender zu besprechen. 


9.3 Waagerechte Handbewegungen 


Die nächsten Gestikmuster, auf die in dieser Übersicht einzugehen ist, enthalten 
eine (mehr oder weniger) waagerechte Bewegung der ebenfalls (mehr oder weni- 
ger) waagerecht gehaltenen Hand (bzw. Hände). Die Rede ist zum einen von der 
Geste, die Kendon (2004) als ‚palm lateral‘ bzw. ‚Open Hand Supine with lateral 
movement‘ (kurz ‚PL‘) bezeichnet, zum anderen von der ‚horizontal palm‘-Geste 
(kurz ‚ZP‘), einer Variante der ‚Open Hand Prone‘ mit waagerecht gehaltener 
Hand. Diese beiden Gestikmuster weisen auf der Formebene beachtliche Über- 
einstimmungen auf, und auch von der Bedeutung her liegt eine gewisse Ähnlich- 
keit vor. Daher sollen die beiden hier gemeinsam besprochen werden. 

Für die PL-Geste liefert Kendon (2004: 265) folgende Umschreibung: „the o- 
pen hand with palm up is moved laterally and often somewhat backwards [...] 
both hands are often employed.“ Es handelt sich also um eine Geste, bei der die 
geöffnete Hand (im Korpus ist es tatsächlich immer eine flache Hand oder eine 
Schüsselhand), mit der Handfläche nach oben gerichtet (‚palm up‘) oder leicht 
verkantet (‚palm up-center‘), zur Seite und ggf. leicht nach hinten bewegt wird. 
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Die Bewegung wird meist im unteren Teil des Gestenraums realisiert, typischer- 
weise als eine Bewegung aus dem unteren Zentrumsbereich (‚lower center‘) in die 
Peripherie oder wenigstens in den Grenzbereich zwischen Zentrum und Periphe- 
rie*, allerdings auf etwa der gleichen Höhe. Wie Kendon bereits gezeigt hat, han- 
delt es sich meist um eine zweihändige Geste (nur 8 der 65 PL-Belege im Korpus 
sind einhändig). In diesen Fällen ist die Bewegung der beiden Hände meist un- 
gefähr symmetrisch, obwohl eine Hand etwas höher gehalten werden kann oder 
etwas stärker verkantet sein kann als die andere. 


(8) PR_Cap0811 
111 IC DES ist mehr demokratIE, 


1:12 und SIE, 

113 wenn sie auf die plebiszitÄre KARte setzen, 

114 und wir !AUCH! sagen dass die bevölkerung 
inbezogen werden soll, 

IIS > dann Ist die EInführung (.) äh der 


möglichkeit dass es bÜrgerinitiativen gibt 
in der europäischen union {was POsitives;} 


Abb. 23: Beidhändiger ‚palm lateral‘ 


Bei der Besprechung der ZP-Geste kann ebenfalls von Kendons (2004: 255) 
Umschreibung ausgegangen werden: „the open hand is held so that the palm 
faces horizontally downwards or at an oblique angle [...] the hand is moved in a 
rapid horizontal lateral movement, away from the midline of the speaker’s body. 
[The ZP gesture] may be performed with one hand or with two.“ In gewissem 
Maße ist die ZP-Geste also das Gegenstück der PL-Geste: Auch in diesem Fall wird 


4 Der Begriff ‚palm lateral‘ wird also breiter aufgefasst, als was Müller (2014) unter „Palm Up 
Open Hand combined with wide lateral motion“ versteht: Auch kleinere Bewegungen können 
als ‚palm lateral‘ gelten. 


166 — Weitere abtönende Gesten 


die geöffnete Hand (flache Hand oder Schüsselhand) zur Seite bewegt (meist al- 
lerdings nicht nach hinten, dafür gelegentlich leicht nach unten), und zwar typi- 
scherweise im unteren Bereich des Gestenraumes (meist aus dem zentralen Be- 
reich in den peripheren Bereich). Zudem ist auch in diesem Fall sowohl die 
einhändige als auch die beidhändige Realisierung möglich, obwohl - wie auch 
schon aus Kendons Beschreibung hervorgeht - die einhändige Realisierung bei 
der ZP geläufiger ist als bei der PL (im Korpus sind 8 der 13 ZP-Belege als einhän- 
dig einzustufen). Die einzigen wichtigen formalen Unterschiede bestehen darin, 
dass die Handfläche bei der ZP nach unten gerichtet ist - und zwar direkt nach 
unten gerichtet (‚palm down‘) oder leicht verkantet (‚palm down-center‘) - und 
dass die ZP im Allgemeinen etwas kürzer ist: Während die PL sich häufig über 
einen längeren Teil der Intonations- bzw. Äußerungseinheit erstreckt und gele- 
gentlich einen deutlichen Hold aufweist, ist die ZP eine kurze Geste, deren Stroke 
(bis auf wenige Ausnahmen) nur mit der hauptbetonten Silbe überlappt. 


(9) FG_A3a 
1163 WN ja die LINDsey vonn hat s schon 
Angesprochen; 
1164 NÄCHste chance, 
1165 FREItag- 
1166 die SUperkombination- 
1167 > da ist sie {EIne der TOP}favoritinnen. 


s > - 


Abb. 24: ‚horizontal palm‘ 


Letztere Beobachtung ist durchaus bemerkenswert, da Harrison (2010) ge- 
rade die ZP-Geste (die er als ‚PDacross‘ bezeichnet) als eine der Gesten heran- 
zieht, die seine These illustrieren sollen, dass die Dauer einer Geste ein Indiz ihres 
Skopus sein kann. Das heißt, dass die Geste einen deutlichen Hold aufweist (bzw. 
aufweisen kann), was sie jedoch in meinen Daten nicht tut. Ein weiterer Unter- 
schied zwischen Harrisons Beschreibung und meinen Daten besteht darin, dass 
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Harrison (2009: 95) zufolge bei der ZP die Hand nicht von der Mittellinie des Kör- 
pers zur Seite bewegt werde, wie es Kendon in seiner oben zitierten Beschreibung 
behauptet, sondern vielmehr diese Mittellinie überschreite: Der Stroke einer 
PDacross, bei der die Hand nach rechts bewegt wird (und die also mit der rechten 
Hand realisiert wird), fange vor der linken Körperhälfte an und umgekehrt. Im 
Korpus lässt sich allerdings nur ein einziger Beleg vorfinden, auf den dies zutrifft; 
in den zwölf weiteren Belegen der ZP überschreiten die Hände die Mittellinie des 
Körpers nicht. Inwiefern dies darauf zurückzuführen ist, dass Harrison die ZP als 
Negationsgeste des Englischen und nicht als Abtönungsgeste des Deutschen ana- 
lysiert, muss im Rahmen dieser Arbeit dahingestellt bleiben. 

Interessant wäre in dieser Hinsicht auch, die negierende Verwendung der ZP 
im Deutschen eingehender zu betrachten und mit der abtönenden zu verglei- 
chen, was allerdings mit nur einem Beleg der negierenden ZP im Korpus nicht 
möglich ist.’ Sollte sich tatsächlich ein formlicher Unterschied zwischen der ne- 
gierenden und der abtönenden ZP nachweisen lassen, so dürfte dieser auf die für 
Grammatikalisierung typischen Formveränderungen zurückzuführen sein, denn 
tatsächlich scheint sich (ähnlich wie beim Kopfschütteln) die abtönende Verwen- 
dung der ZP aus der negierenden entwickelt zu haben. Diese historische Ver- 
wandtschaft zeigt sich auch eindeutig auf der Ebene der Funktion. Wie Kendon 
(2004: 255) angibt, geht die Form der ZP auf das Bild des Abschneidens bzw. 
Durchschneidens einer senkrechten Linie zurück. Bei der negierenden Verwen- 
dung steht diese imaginäre Linie für die Möglichkeit des Sachverhalts, der negiert 
wird (vgl. auch Calbris 2003: 35-36), und ein ähnliches Bild liegt der abtönenden 
Verwendung zugrunde: Es gibt keine andere Möglichkeit als die angesprochene 
(die Linien der etwaigen anderen Möglichkeiten werden durch die Geste durch- 
geschnitten), und dementsprechend erübrigen sich weitere Diskussionen. 

Eine alternative, aber durchaus damit verträgliche, Umschreibung liefern 
Bressem/Müller (2014: 1602) (s. auch Müller 2014: 145). Sie bezeichnen diese 
Geste als ‚sweeping away‘, und sehen darin tatsächlich eine wegfegende Bewe- 
gung: Durch die Bewegung wird Unangenehmes weggefest. In diesem konkreten 
Fall handelt es sich also um das Wegfegen der Alternativen (andere Möglichkei- 
ten oder Ansichten), die dadurch negiert werden, sodass genügend Platz da ist 
für die eigene Behauptung, die nicht durch das Weggefegte gestört wird und also 
als unangefochten gilt. 


5 Dieser eine negierende Beleg der ZP im Korpus weist tatsächlich einen Hold auf, wie ihn Har- 
rison für die englische Negationsgeste beschreibt. Allerdings quert auch in diesem einen Beleg 
die Hand die Mittellinie des Körpers nicht. 
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Welche der beiden Erklärungen die plausiblere ist, kann an dieser Stelle 
nicht geklärt werden, aber das Ergebnis ist gleich: Alle Alternativen werden ab- 
gelehnt. Dies zeigt sich auch in Beispiel (9): Dass sie (die Rede ist von Schifahre- 
rin Maria Höfl-Riesch) für den bevorstehenden Superkombinationswettbewerb 
zu den Topfavoritinnen gehört, steht nicht weiter zur Diskussion; der Sprecher 
schließt durch die Geste alle anderen Möglichkeiten (und damit jegliche Diskus- 
sion) aus.° 

Im Grunde genommen ist die Funktion der PL-Geste nicht wesentlich anders, 
obwohl sie auf ein anderes Bild zurückzuführen ist. Kendon (2004: 265) um- 
schreibt den zentralen Bedeutungsaspekt der PL-Geste als ‚withdrawal‘. Die PL- 
Geste ähnelt von der Form her einer assertiv-bietenden Geste (d. h. eine Geste, 
die metaphorisch das geben von Informationen abbildet, vgl. Abschnitt 10.2), 
und vielfach folgt sie auch einer solchen Geste oder ihr Anfang ist auch als eine 
solche zu interpretieren. Mit der PL-Geste zieht sich der Sprecher dann von die- 
sem Anbieten der Information zurück. Die Information (bzw. die Äußerung) sel- 
ber wird jedoch nicht zurückgenommen, sondern sie wird stehen gelassen. Im 
Grunde genommen sind hier zwei mögliche (und von Kendon vorgeschlagene) 
Interpretationen relevant. Eine Möglichkeit ist, dass der Sprecher andeutet, nicht 
für den dargestellten Sachverhalt verantwortlich zu sein bzw. nichts dafür zu 
können, und dementsprechend gestisch die Hände davon abzieht. Der Sachver- 
halt ist so, wie er dargestellt wird, und der Sprecher kann (oder will) ihn selber 
auch nicht ändern. Die andere Möglichkeit ist, dass der Sprecher mittels der PL- 
Geste angibt, dass sich ihm zufolge weitere Diskussionen oder Erläuterungen er- 
übrigen: Der Sachverhalt ist so, wie er ihn dargeboten hat, und er sieht keinen 
Grund, weiter darauf einzugehen, was er durch das Abziehen der Hände von die- 
sem Sachverhalt markiert. Dies ist die Funktion, die in Beispiel (8) vorliegt: Für 
den Sprecher steht außer Streit, dass die beschriebene Entwicklung (unter den 
erwähnten Umständen) als positiv zu betrachten ist, und er möchte also auch 
nicht weiter darüber diskutieren. 

Die beiden Interpretationen der PL-Geste (unabänderlich und nicht weiter 
zur Diskussion stehend) sind eng miteinander verwandt und ein klarer Unter- 
schied ist nicht immer zu machen. Zudem erinnern sie, ähnlich wie die Funkti- 
onsbeschreibung der ZP-Geste, an die Bedeutungsfacetten des Clusters 2b, die im 
Abschnitt 2.3.3 aufgelistet wurden. Daher soll es nicht verwundern, dass diese 


6 In der Hinsicht dürfte das Zusammenfallen der Geste mit der hauptbetonten Silbe nicht nur 
auf McNeills phonetische Synchronieregel zurückzuführen sein, sondern ebenfalls darauf, dass 
die hauptbetonte Silbe im Allgemeinen das wichtigste Element des nicht weiter zur Diskussion 
stehenden Sachverhalts (d. h. des Skopus der Geste) ausdrückt. 
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Gesten im Korpus häufiger mit den zentralen Partikeln dieses Clusters (eben, ein- 
fach, halt) kookkurrieren. Allerdings handelt es sich immerhin nur um die Hälfte 
der Belege, in denen die Geste mit einer Modalpartikel kombiniert wird: 9 von 18 
im Falle der PL, 2 von 4 im Falle der ZP. In den anderen Fällen geht mit der Geste 
eine Partikel des Clusters 2a (ja, doch) einher, was insofern nicht verwunderlich 
ist, als bereits mehrfach angesprochen wurde, dass sich der Cluster 2a als das 
‚schwächere‘ Gegenstück zum Cluster 2b einstufen ließe. Die Frequenzen sind 
aber auch in diesem Fall wieder zu niedrig für eine eingehende Kookkurrenzana- 
lyse: Die PL ist an sich mit 65 Belegen noch einigermaßen stark vertreten, aber 
die ZP ist insgesamt nur 13 Mal belegt, und die Anzahl der Belege, in denen diese 
Gesten mit einer Modalpartikel einhergehen, beschränkt sich auf 18 und 4. Da 
sich zudem keine deutliche Präferenz für eine bestimmte Partikel oder gar einen 
bestimmten Partikelcluster (2a oder 2b) abzeichnet, soll auch für diese beiden 
Gesten die Kookkurrenzanalyse an dieser Stelle nicht weitergeführt werden. 


9.4 Börsenhand und senkrechter Ring 


Zum Abschluss dieser Übersicht weiterer abtönender Gesten sind noch zwei 
Gestikmuster zu nennen, die ähnlich wie PL und ZP sowohl von der Form her als 
auch auf Bedeutungsebene eine gewisse Übereinstimmung aufweisen: die Bör- 
senhand und der senkrechte Ring. 

Eine Schwierigkeit mit dem Begriff ‚Börsenhand‘ (bzw. auch mit seinen eng- 
lischen Gegenstücken ‚purse hand‘ und ‚finger bunch‘) ist, dass er zur Bezeich- 
nung unterschiedlicher Gestikmuster verwendet wird, denen gemeinsam ist, 
dass die Hand während des Ablaufs der Geste eine bestimmte Form annimmt, die 
selber auch gelegentlich als Börsenhand bezeichnet wird. Gemeint ist die Hand- 
form, die im Abschnitt 6.1im Anschluss an u. a. Weinrich (1992) und Müller (1998) 
als Spitzhand bezeichnet wurde (vgl. Abbildung 25), und die Kendon (2004: 228f.) 
mit einem italienischen Begriff als ‚grappolo‘ bezeichnet. 


Abb. 25: Spitzhand (nach Kendon 1995: 250) 
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Im Folgenden soll der Begriff ‚Spitzhand‘ weiterhin für die Bezeichnung die- 
ser Handform reserviert bleiben, während mit dem Begriff ‚Börsenhand‘ auf eine 
bestimmte Geste verwiesen wird, die mit der Spitzhand realisiert wird. Es handelt 
sich um die Geste, die u. a. Kendon (u. a. 2004: 231) - erneut mit einem italieni- 
schen Begriff - als ‚mano a borsa‘ bezeichnet. Wie auch im vorigen Abschnitt 
kann für die Beschreibung der Geste von Kendons (a. a. O.) Darstellung ausge- 
sangen werden. Er umschreibt die Börsenhand folgendermaßen: „the grappolo 
is held on a supine forearm and is moved upwards and sometimes somewhat to- 
ward the speaker several times.“ In den meisten Fällen wird die Börsenhand ein- 
händig realisiert, obwohl auch drei Belege der zweihändigen Realisierung vorlie- 
gen (u.a. in Beispiel (10)). Die Geste wird meist im Zentrumsbereich des Gesten- 
raums realisiert (‚center center‘ oder ‚left center‘ bzw. ‚right center‘), allerdings 
nicht am unteren Rande, wie das bei den PL- und ZP-Gesten der Fall war. In den 
meisten Fällen wird die Geste so realisiert, dass die Fingerspitzen nach oben zei- 
gen (obwohl die Hand auch leicht nach innen verkantet sein kann). In vier Bele- 
gen ist die Geste auch leicht nach vorne gerichtet, was allerdings (wie im nach- 
stehenden Beispiel) meist darauf zurückzuführen ist, dass sich der Sprecher 
leicht nach vorne beugt; die Position vis-à-vis dem Körper des Sprechers bleibt 
also gleich. 


(10) PR_Strac0811 


043 HS und SAgen wir die wAhrheit. 

044 i mein sIE haben s es heute selber an selbst 
ANgesprochen herr bundeskanzler; 

045 £frAgen sie doch die österreicher haben sie 
UNS zugeworfen, 

046 der FREIheitlichen fraktiOn; 

047 > {ja FRAgen sie doch die Österreicher herr 
bundeskanzler, } 

048 {lAssen sie sie ABstimmen; } 


Abb. 26: Börsenhand 
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Die Geste, die als ‚senkrechter Ring‘ bezeichnet wird, lässt sich mit Kendon 
(2004:245) folgendermaßen umschreiben: „the hand, posed in the Ring shape, 
held so the palm of the hand is vertical [...] is moved downward or forward in one 
or more well-defined baton-like movements.“ Mit ‚Ring‘ ist die Handform ge- 
meint, bei der der Daumen und der Zeigefinger eine Art Kreis bilden, während die 
anderen Finger weniger stark gebogen sind. Auf Andrea de Jorios Arbeiten zu- 
rückgreifend stellt Kendon den Ring wie in Abbildung 27 dar. Allerdings weckt 
diese Darstellung eher den Eindruck, dass es sich um einen eher ‚spitzen‘ Ring 
handelt und dass die anderen Finger ziemlich weit auseinander liegen, während 
das beim senkrechten Ring nicht unbedingt der Fall ist. In der Hinsicht stimmt 
die Handform des senkrechten Rings eher mit Bressems (2013) Darstellung von 
‚1-2 connected‘ überein (s. Abbildung 28). 
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Abb. 27: Ring (nach Kendon 1995: 268) 
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Abb. 28: ‚1-2 connected‘ (nach Bressem h N. 


Wie aus der oben zitierten Beschreibung Kendons hervorgeht, zeigt jedoch 
im Grunde genommen keine dieser Abbildungen die für den senkrechten Ring 
typische Orientierung der Hand. Im Normalfall ‚zeigen‘ nämlich bei dieser Geste 
der Daumen und der Zeigefinger nach oben (obwohl auch diese Geste, ähnlich 
wie die Börsenhand, leicht nach innen verkantet sein kann). Typischerweise wird 
diese Geste, ähnlich wie die Börsenhand, im Zentrum des Gestenraums realisiert, 
allerdings meist nicht im Kernbereich (‚center center‘) oder im unteren Teil des 
zentralen Bereiches, sondern eher auf der Seite (‚left center‘ bzw. ‚right center‘). 
Im Gegensatz zur Börsenhand wird diese Geste immer einhändig realisiert. 


7 Kendon (a. a. O.) bezeichnet diese Geste im Englischen als ‚R-vertical‘ (mit R als Kürzel für 
‚Ring‘). ‚Baton‘ ist eine andere Bezeichnung der Taktstockgesten. 
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(11) FG_GOvid1? 
026 PP und das Ist ein WEIterer punkt- 


027 den wir untersuchen MÜSsen im rahmen eines 
untersUchungsausschusses, 

028 waRUM hat es hier nicht vollständige 
informatiOn gegeben. 

029 [es gIbt den zitierten 

030 H [bItte das ist doch FALSCH? 

031 PP es [!GIBT! den zitierten 

032 H [sie wIssen doch [GANZ ge 

033 PP [lAssen s 

034 lAssen [sie 

035 HM > [{sie wIssen doch ganz genau dass sie 
jetzt LÜgen; } 

036 PP [herr 

037 H [{sie wissen GANZ genau dass sie lÜgen, } 

038 {und gEhen mit einer MENschenverachtung vor, } 

039 {die !UN!geheuerlich ist herr plIlz;} 


Abb. 29: Senkrechter Ring 


Ähnlich wie bei dem Gestenpaar PL-ZP lässt sich bei der Börsenhand und 
dem senkrechten Ring eine gewisse funktionale Ähnlichkeit nachweisen. Ken- 
don (2004: 231) gibt an, dass die Börsenhand im Italienischen typischerweise als 
eine Art Fragemarkierer eingestuft wird, der vor allem eingesetzt wird, wenn der 
Sprecher mit etwas Unerwartetem oder für ihn Unverständlichem konfrontiert 
wird. Dies erinnert an die im Abschnitt 2.3.1 gelieferte Umschreibung der Partikel 
denn. Im Korpus liegt allerdings nur ein Beleg der Börsenhand mit einer Frage 
vor, die zudem nicht die Partikel denn enthält, sondern die Partikel eigentlich: 


8 Vermutlich produziert Sprecher HM auch schon einen senkrechten Ring zu den Einheiten 030 
und 032; infolge des suboptimalen Kamerastandpunktes ist dies jedoch nicht eindeutig festzu- 
stellen, sodass bei diesen Einheiten im Transkript keine Geste angegeben wurde. 
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(12) PR_West3010 
038 PW wAs haben s euch eigentlich alles geBOten, 


039 dass ihr auf dieser rOten krlIEchspur am 
Ersten parlamEntstag daHERkommt, 

040 und eine lInke koalition offenbar in dem 
haus wollt und Möglich macht; 

041 dass ihr euch mit hAUt und haaren (.) rot 
und grün Unterordnet; 

042 jetzt auch noch schön applauDIERT nach dem 
Antrag, 

043 des ist wIrklich eine interesSANte sache, 

044 > {tUt des net WEH eigentlich?} 

045 {der tÄgliche DIEner den ihr macht, } 

046 {der tägliche dIEner vor rot-GRÜN, } 


Es ist tatsächlich möglich, dass die Geste hier markiert, dass die Frage aus 
etwas Unerwartetem folgt, nämlich aus der Tatsache, dass die Freiheitlichen (an 
die sich der Sprecher hier direkt wendet) aus der Opposition die Regierung mit 
Sozialdemokraten und Grünen unterstützen.’ Allerdings dürfte eine andere Inter- 
pretation eher auf der Hand liegen. Kendon (1995: 257) gibt nämlich an, dass die 
Börsenhand auch dazu dienen kann, die Handlungen des Hörers (in diesem Fall 
also die Unterstützung der Regierung) zu hinterfragen. In der Hinsicht lässt sich 
die Geste mit der Adversativen Bedeutung von doch verknüpfen: Sowohl die Par- 
tikel als auch die Geste deutet an, dass vom Hörer eine Anpassung seiner Hand- 
lungen (oder Annahmen) erwartet wird. In dieser Verwendung ist die Börsen- 
hand im Korpus 16 Mal belegt, darunter auch zweimal im oben angeführten 
Beispiel (10). In diesem Beispiel hinterfragt und kritisiert der Sprecher das Beneh- 
men des Bundeskanzlers (konkret die Tatsache, dass er seinem eigenen Rat- 
schlag an die Opposition, die Meinung der Bevölkerung zu berücksichtigen, nicht 
folgt). 

Eine gewisse Adversativität ist auch bei dem senkrechten Ring nachzuwei- 
sen. Tatsächlich sieht Kendon (2004: 245) die Funktion dieser Geste darin, anzu- 
deuten, dass der Sprecher einen spezifischen Punkt hervorhebt, der etwas vorher 
Erwähntem oder einer offensichtlichen Hörerannahme widerspricht. Dies zeigt 
sich auch in Beispiel (11): Hans Mayr (HM) hebt hervor, dass die Aussagen seines 
politischen Kontrahenten Peter Pilz (PP) seiner Meinung nach gelogen sind, und 
schränkt so deren Gültigkeit ein bzw. widerspricht ihnen, in der Hoffnung, dass 
Pilz seine Ansichten anpasst. In der Hinsicht stimmen die Börsenhand und der 


9 Obwohl die Geste die durch eigentlich abgetönte Einheit begleitet, ist sie m. E. nicht direkt mit 
der Partikel zu verknüpfen. Neben der Bedeutung der Geste ist ein Indiz (aber kein Beweis) dafür, 
dass die rechtsversetzte Partikel nicht vom Stroke der Geste begleitet wird. 
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senkrechte Ring von der Funktion her also weitgehend überein; der Unterschied 
besteht darin, dass die Börsenhand lediglich kritisiert bzw. hinterfragt, während 
mit dem senkrechten Ring zusätzlich die widersprechende Äußerung hervorge- 
hoben wird. 

Aufgrund dieser Adversativitätsbedeutung soll es nicht wundern, dass die 
Partikel, mit der die Börsenhand und der senkrechte Ring die stärkste Beziehung 
aufweisen, die Partikel doch ist. Tatsächlich ist dies die einzige Partikel, die mit 
diesen Gesten kookkurriert (abgesehen vom Einzelbeleg mit eigentlich in (12), in 
dem die Geste nicht direkt mit der Partikel zu verknüpfen scheint): Jeweils drei 
der insgesamt 16 Belege der Börsenhand und 22 Belege des senkrechten Ringes 
gehen mit einem doch einher. Damit sind auch in diesem Fall die Frequenzen (so- 
wohl der Einzelgesten als auch der Partikel-Geste-Kombination) für eine weiter- 
führende Detailanalyse zu niedrig. 

Zum Schluss sei noch kurz darauf zurückgekommen, dass die denn-ähnliche 
Verwendung der Börsenhand, die laut Kendon (2004) im Italienischen als die 
zentrale Verwendung dieser Geste betrachtet wird, in den Daten nur in einem 
Grenzfall belegt ist, in dem auch eine andere Interpretation möglich ist (s. Bei- 
spiel (12)). Dies könnte auf Zufall zurückzuführen sein, aber es ist nicht auszu- 
schließen, dass der regionale Unterschied eine Rolle spielt. Interessant ist in die- 
ser Hinsicht auch, dass die Börsenhand, die gelegentlich als eine typisch italieni- 
sche Geste betrachtet wird, im Korpus auch nur in den österreichischen Daten 
belegt ist. Dies könnte damit zu tun haben, dass die Geste vor allem bei größerer 
Aufregung verwendet wird, während die deutschen Fernsehdaten keine heftige- 
ren Diskussionen enthalten, aber es wäre ebenfalls möglich, dass die Nähe von 
Österreich zu Italien als ein Teil der Erklärung anzuführen ist, in dem Sinne, dass 
die österreichische Gestik der italienischen stärker ähnele als die deutsche (vgl. 
Morris 1994: 116). Hier liegen also noch Möglichkeiten für weitere Untersuchun- 
gen. 


9.5 Abtönende Kinaestheme 


In den beiden letzten Abschnitten wurden jeweils zwei Gestikmuster besprochen, 
die neben bestimmten formlichen Übereinstimmungen auch eine gewisse Ähn- 
lichkeit auf Bedeutungsebene aufweisen. Im Hinblick auf diese Beobachtung 
stellt sich die Frage, ob sich allgemeiner bei den abtönenden Gesten bestimmte 
Kinaestheme nachweisen lassen. Der Begriff ‚Kinaesthem‘ wurde von Fricke 
(2012: 102) eingeführt, und sie definiert ihn folgendermaßen: 
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Ein Kinaesthem ist eine Menge intersubjektiv semantisierter Bewegungstoken, deren Ähn- 
lichkeit auf der Ausdrucksseite mit einer Ähnlichkeit auf der Inhaltsseite korreliert. Die 
Ähnlichkeitsrelation auf der Inhaltsseite entspricht der Relation der Familienähnlichkeit 
nach Wittgenstein. 


Anders formuliert: Von einem Kinaesthem ist die Rede, wenn Gesten, diesich von 
der Form her ähneln, auch auf Bedeutungsebene miteinander verwandt sind. 

Im Hinblick auf diese Definition des Kinaesthembegriffs stellt sich die Frage, 
ob Kinaestheme nicht auch als Konstruktionen einzustufen wären. Tatsächlich 
ist ein Kinaesthem der Definition zufolge als eine Paarung von Formeigenschaf- 
ten und Bedeutungseigenschaften zu betrachten, die durch mehrere Gestikmus- 
ter geteilt wird. In der Hinsicht ist das wichtigste Definitionskriterium einer Kon- 
struktion (eine symbolische Paarung von Form und Bedeutung, vgl. Abschnitt 
4.1.1) eigentlich erfüllt. Es handelt sich zwar um eine sehr schematische Kon- 
struktion, die über mehrere konkretere Gestikmuster abstrahiert, aber im vierten 
Kapitel wurde angegeben, dass Konstruktionen durchaus einen hohen Abs- 
traktheitsgrad aufweisen können. Auch die Tatsache, dass es sich im Gegensatz 
zu traditionellen verbalen Konstruktionen um rein gestische Einheiten handelt, 
ist kein Argument gegen eine Einstufung als Konstruktion, da auch Gesten sym- 
bolische Form-Bedeutungspaare sind (vgl. dazu auch Abschnitt 14.1.2). Eine Ein- 
stufung von Kinaesthemen als (abstrakten gestischen) Konstruktionen scheint 
also durchaus gerechtfertigt. Trotzdem wird im weiteren Verlauf dieses Ab- 
schnitts der Kinaesthembegriff verwendet, um anzudeuten, dass es sich um 
Strukturen auf dieser schematischen Ebene der Abstrahierung über einzelne 
Gestikmuster handelt. 

Zwischen den in den vorangehenden Kapiteln besprochenen Gestikmustern 
lassen sich gewisse Übereinstimmungen nachweisen, die für eine Analyse als 
Kinaesthem in Betracht kommen. Man könnte zum Beispiel annehmen, dass ein 
leichter Beat mit einer zum Teil geschlossenen Hand (d. h. bei dem sich wenigs- 
tens Daumen und Zeigefinger berühren) und nach oben gerichteten Fingern, wie 
er bei der Börsenhand und dem senkrechten Ring nachzuweisen ist, eine doch- 
ähnliche kritisierende Wirkung hat. Ähnlich suggerieren die Daten, dass eine 
waagerechte Bewegung der (ebenfalls waagerechten) geöffneten Hand zur Seite 
markiert, dass weitere Diskussion nicht erwünscht wird (vgl. PL und ZP). Die ge- 
naue Orientierung der Handfläche (nach oben bzw. nach unten gerichtet) macht 
zwar für die genaue Interpretation (sowie für das ihr zugrunde liegende Bild) ei- 
nen Unterschied aus, aber das Kinaesthem bezieht sich auf die abstraktere Ebene 
der Gemeinsamkeiten (die seitliche Handbewegung der waagerechten Hand und 
die Bedeutung des Abschließens der Diskussion). 
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Bei den abtönenden Gesten ist allerdings ein allgemeineres Muster zu erken- 
nen. Für die rein emblematischen Kopfgesten gilt, dass die senkrechte Bewegung 
(Nicken) mit einer positiven Bedeutung zu verknüpfen ist (Bestätigung, Zustim- 
mung), die waagerechte Bewegung (Kopfschütteln) dagegen mit einer negativen 
(Negation, Ablehnung), und auch bei den abtönenden Gesten scheint eine solche 
Tendenz vorzuliegen. Tatsächlich markiert das abtönende Nicken, dass der Spre- 
cher seine Aussage für wahr hält, und ähnlich ist der Beat, infolge seiner insistie- 
renden bzw. hervorhebenden Wirkung, ein Zeichen dafür, dass der Sprecher zu 
seiner Aussage steht. Demgegenüber enthalten die Gesten mit einer waagerech- 
ten Bewegung eine implizite Negation: Mit dem abtönenden Kopfschütteln gibt 
der Sprecher an, keine andere Möglichkeit zu sehen, mit der ZP schließt er andere 
Möglichkeiten aus, und mit der PL zieht er sich zurück und will keine weitere 
Diskussion. Mit den senkrechten Bewegungen markiert der Sprecher also eine 
positive Stellungnahme gegenüber dem Inhalt des Gesagten, während er mit den 
waagerechten Bewegungen eine negative Stellungnahme markiert, allerdings 
nicht gegenüber der vermittelten Information, sondern gegenüber möglichen 
Einwänden, Bedenken oder Gegenargumenten vonseiten des Hörers. 

Man könnte aber eine noch allgemeinere Perspektive einnehmen, die es er- 
laubt, auch das Achselzucken einzubeziehen. Diese bezieht sich auf den Gesten- 
raum. Bewegungen tiefer in den Gestenraum hinein sind dann als positiv einzu- 
stufen, während Bewegungen in der anderen Richtung eine negative Beurteilung 
beinhalten. In dieser Hinsicht ist es auffällig, dass alle im vorigen Absatz aufge- 
listeten senkrechten Gesten eigentlich Bewegungen nach unten sind. Am deut- 
lichsten zeigt sich das beim Beat: Der Stroke ist die Abwärtsbewegung (der Down- 
beat). Obwohl es beim Nicken schwieriger ist, aufrechtzuerhalten, dass die 
Abwärtsbewegung als der Stroke zu betrachten sei (vgl. die Frage, ob bei den 
Kopfgesten überhaupt eine Einteilung in Vorbereitung, Stroke und Rückzug mög- 
lich ist), handelt es sich auch hier um eine Bewegung, die aus der aufrechten Ru- 
heposition vor allem nach vorne bzw. nach unten gerichtet ist (auch wenn eine 
leichte Aufwärtsbewegung am Anfang nachzuweisen sein kann, vgl. Ishi et al. 
2014: 236). Ersichtlich wird dies bei einem Vergleich mit dem Bulgarischen. In 
dieser Sprache besteht neben dem Nicken als bejahender Geste, mit der gleichen 
Form wie im Deutschen, auch eine ablehnende oder verneinende Geste, die gele- 
gentlich als Nicken bezeichnet wird, bei der allerdings der Kopf eher nach oben 
und nach hinten bewegt wird (s. Kolarova [2011: 139], die zur Bezeichnung der 
letzteren Geste vom ‚Zurückwerfen‘ des Kopfes spricht). Zwar handelt es sich hier 
erneut um Embleme, aber die Tendenz bleibt weiterhin gültig: in den Gestenraum 
hinein (Nicken) ist positiv, aus dem Gestenraum hinaus (das sogenannte ‚Zurück- 


Abtönende Kinaestheme — 177 


werfen‘) ist negativ. Obwohl das Nicken, sei es emblematisch-bejahend oder ab- 
tönend, eine Auf-und-ab-Bewegung ist, ist es also immerhin als eine Bewegung 
in den Gestenraum hinein zu sehen. 

Im Gegensatz dazu stehen die Gesten, bei denen eine Bewegung aus dem 
Gestenraum hinaus (nach oben, nach hinten oder zur Seite) vorliegt. Bei den drei 
zuvor aufgelisteten Gesten (Kopfschütteln, PL und ZP) ist die Bewegung zur Seite 
deutlich wahrnehmbar. Im Falle des Kopfschüttelns kann zwar vielleicht nicht 
von einer deutlichen Bewegung des Kopfes aus dem Gestenraum die Rede sein, 
da der Kopf selber nicht nach oben oder nach hinten bewegt wird, aber durch die 
Schüttelbewegung wird wenigstens das Gesicht wiederholt vom Zentrum des 
Gestenraums abgewandt. Bei der PL und der ZP ist die Entfernung deutlicher zu 
sehen, da die Hände tatsächlich vom Kernbereich des Gestenraums weg (zur 
Seite und bei der PL zudem gelegentlich leicht nach hinten) bewegt werden. 

Der Vorteil dieser Analyse gegenüber der vorigen ist, dass in dieser Analyse 
auch das Achselzucken berücksichtigt werden kann. Das Achselzucken ist eher 
eine senkrechte Bewegung, aber trotzdem wurde es in der Besprechung im Ab- 
schnitt 10.2 ähnlich wie das Kopfschütteln als implizit negativ eingestuft. Für die 
Analyse nach dem Motto ‚senkrecht ist positiv, waagerecht ist negativ‘ stellte das 
Achselzucken also einen problematischen Fall dar. Mit der neueren Analyse stellt 
sich das Problem jedoch nicht: Das Achselzucken ist eine Bewegung nach oben, 
d. h. aus dem Gestenraum hinaus, was mit der impliziten Negation im Einklang 
ist. 

Auffällig ist, dass sich die Gesten der negativen Stellungnahme (d. h. die Be- 
wegungen aus dem Gestenraum hinaus) vor allem mit Cluster 2b (eben, einfach, 
halt) verknüpfen lassen, während das Nicken als Geste der positiven Stellung- 
nahme (tiefer in den Gestenraum hinein) eher mit Cluster 2a (insbesondere mit 
ja) zu verknüpfen ist. Dies lässt sich auch mit der Bedeutung der jeweiligen Par- 
tikeln verknüpfen: Während die Partikeln des Clusters 2a vor allem eine positive 
Stellungnahme zur Äußerung andeuten und wahrheits- bzw. einverständnismar- 
kierend wirken, sind die Partikeln des Clusters 2b als etwas stärker einzustufen, 
in dem Sinne, dass sie kategorischer wirken und - indem sie den Sachverhalt als 
evident o. ä. markieren - wirklich zum Ziel haben (können), den Hörer von mög- 
licher Diskussion abzuhalten, was mit der negativen Stellungnahme der Gesten 
gegenüber möglichen Einwänden oder Bedenken zu verknüpfen ist. Dies ist kein 
Eins-zu-eins-Verhältnis: Der Beat ist als Geste der positiven Stellungname immer- 
hin eher mit Cluster 2b zu verknüpfen, und auch die anderen Gesten der positiven 
Stellungnahme können durchaus mit den Partikeln des Clusters 2b einhergehen. 
Letzteres hat seinerseits damit zu tun, dass eine negative Stellungnahme gegen- 
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über potenziellen Einwänden als eine positive Stellungnahme der eigenen Äuße- 
rung gegenüber interpretiert werden kann (vgl. Abschnitt 2.3.3: die Evidenzmar- 
kierung des Clusters 2b impliziert die Wahrheitsmarkierung des Clusters 2a). 
Nichtsdestoweniger scheint hier ein Zusammenhang zwischen den Dimensionen 
des Kinaesthems und den Partikelclustern 2a/b vorzuliegen. 

Immerhin bleiben noch drei abtönende Gesten übrig, die nicht in diese 
Kinaesthemanalyse hineinpassen: das intersubjektive Deiktikum, die Börsen- 
hand und der senkrechte Ring. Bei den beiden letzteren Gesten ist das damit zu 
verknüpfen, dass sie keine richtige Bewegung enthalten. Zwar werden sie inhä- 
rent häufig mit einem Beat kombiniert, aber dieser weist im Allgemeinen nur eine 
beschränkte Amplitude auf (jedenfalls beschränkter als etwa in Beispiel (1)). Die 
Bedeutung dieser Gesten entsteht vor allem aus der Form und der Haltung der 
Hand, vielmehr als aus der etwaigen Beat-Bewegung. Daher lassen sie sich nicht 
so direkt mit diesem Kinaesthem der positiven bzw. negativen Stellungnahme 
verknüpfen, da in diesem Fall gerade die Richtung der Bewegung eine zentrale 
Rolle spielt. Börsenhand und senkrechter Ring sind aber (wie bereits dargelegt) 
mit einem eigenen Kinaesthem in Verbindung zu bringen, das auf Formebene vor 
allem durch die Form und die Orientierung der Hand (und nicht so sehr durch die 
Richtung der Bewegung) definiert wird. Auf Bedeutungsebene bezieht sich dieses 
Kinaesthem vor allem auf die kritisierende Facette dieser Gesten, die in dem 
Kinaesthem der positiven bzw. negativen Stellungnahme eine weniger promi- 
nente Rolle spielt. 

Auch das intersubjektive Deiktikum kann nicht als eine Bewegungsgeste im 
Sinne von Leonhard (1976) eingestuft werden: Die etwaige Bewegungen bei der 
Realisierung dieser Geste sind eher während der Vorbereitungs- und Rückzugs- 
phase als beim eigentlichen Stroke zu situieren, sodass auch hier das auf der Be- 
wegung beruhende Kinaesthem der positiven bzw. negativen Stellungnahme 
keine Anwendung findet. Zudem ist im Falle des intersubjektiven Deiktikums 
dem Umstand Rechnung zu tragen, dass die Richtung der Geste (bzw. die Rich- 
tung der Bewegung während der Vorbereitungsphase) davon abhängt, wo sich 
die Person, mit der Einverständnis gesucht wird, vis-à-vis dem Sprecher befindet. 
Dies ist darauf zurückzuführen, dass das intersubjektive Deiktikum als einzige in 
dieser Arbeit besprochene abtönende Geste einen deiktischen Ursprung hat, 
während die anderen abtönenden Gesten auf eine metaphorische oder emblema- 
tische Geste zurückzuführen sind. Das intersubjektive Deiktikum wirkt dadurch 
nicht weniger abtönend als die anderen Gesten, aber wie sich herausstellt, hat 
dieser Unterschied durchaus seine Auswirkungen auf die Stelle, die das intersub- 
jektive Deiktikum in der Gruppe der abtönenden Gesten einnimmt. 


10 Weitere abtönunsgsliierte Gesten 


10.0 Einführung 


In den vorangehenden Kapiteln wurde auf die Gesten eingegangen, deren Bedeu- 
tung als abtönend eingestuft werden kann. Allerdings wurde bereits darauf hin- 
gewiesen, dass mit den Modalpartikeln auch andere Gesten einhergehen können, 
die nicht ohne Weiteres als abtönend zu betrachten sind. Auf diese anderen Ges- 
ten soll in diesem Kapitel kurz eingegangen werden. 

Wohlgemerkt sollen, im Anschluss an Kapitel 6.1, nur diejenigen Gesten Be- 
rücksichtigung finden, die als abtönungsliiert gelten können, d. h. von der Wir- 
kung her mit verbalen Abtönungsmitteln (insbesondere Modalpartikeln) zu ver- 
knüpfen sind. Neben den bereits besprochenen abtönenden Gesten handelt es 
sich zum einen um Gesten, die zwar an sich nicht als rein abtönend zu betrachten 
sind, aber immerhin eine verbal ausgedrückte Abtönung hervorheben oder un- 
terstützen (10.1), zum anderen um Gesten, die sich ähnlich wie die Modalparti- 
keln auf den Illokutionstyp der Äußerung beziehen (10.2). Erstere sollen im Fol- 
genden als abtönungsunterstützende, letztere als illokutionstypbezogene Gesten 
bezeichnet werden. Wichtig ist, dass es sich - ähnlich wie bei McNeills Gestenty- 
pen (vgl. Kapitel 3) - nicht um streng abgegrenzte Kategorien handelt, sondern 
vielmehr um Dimensionen, die miteinander interagieren und ggf. kombiniert 
werden können (10.3). 


10.1 Abtönungsunterstützende Gestik 


Ähnlich wie die bereits besprochenen abtönenden Gesten beziehen sich die ab- 
tönungsunterstützenden Gesten auf die abtönende Wirkung eines verbalen Ele- 
mentes (in der vorliegenden Arbeit also: einer Modalpartikel). Im Gegensatz zu 
den abtönenden Gesten sind die abtönungsunterstützenden Gesten allerdings 
nicht als rein abtönend zu betrachten; vielmehr werden mit dem Prädikat ‚abtö- 
nungsunterstützend‘ diejenigen Gesten angedeutet, die selber keine rein abtö- 
nende Bedeutung zum Ausdruck bringen, durch ihr Auftreten aber trotzdem die 
abtönende Wirkung einer Modalpartikel unterstützen. Illustriert werden soll dies 
anhand der referentiellen Zeigegesten. 
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Bei der Vorstellung der Gestikkategorien im dritten Kapitel ist bereits ange- 
geben worden, dass es sich bei den referentiellen Deiktika um diejenigen Zeige- 
gesten handelt, mit denen tatsächlich auf einen bestimmten Referenten gezeigt 
wird. Typischerweise dienen sie dazu, die gemeinte Referentz des Gesagten zu 
identifizieren, dessen Prominenz zu erhöhen oder die Aufmerksamkeit darauf zu 
lenken (u. a. Bangerter 2004, Fricke 2007). An sich ist die Funktion dieser Geste 
also rein referentiell, aber zugleich kann sie auch eine verbale Abtönung unter- 
stützen - und zwar sowohl bei den Partikeln des Clusters 1 (denn, eigentlich) als 
auch bei jenen der Cluster 2a und 2b (ja, doch bzw. eben, einfach, halt). Da im 
letzteren Fall nur konkrete Deiktika abtönungsunterstützend wirken können, 
während eine solche Wirkung im ersteren Fall auch bei den abstrakten Zeigeges- 
ten nicht ausgeschlossen ist, wird zunächst auf Cluster 2a/b eingegangen. 

Die Partikeln der Cluster 2a und 2b haben gemeinsam, dass sie einen Sach- 
verhalt als wahr oder unleugbar darstellen. Zwar kann die genaue Nuance vari- 
ieren (bekannt, evident, unabänderlich, einzigmöglich... - vgl. Kapitel 2), aber 
immer ist das Zutreffen des geäußerten Sachverhalts impliziert. Gelegentlich ist 
dieses Zutreffen auch in der Gesprächssituation deutlich zu sehen, insbesondere 
bei Äußerungen mit es gibt oder ich habe mitgebracht. In solchen Fällen kann 
man das Zutreffen des Gesagten dadurch hervorheben, dass man auf das Ge- 
meinte zeigt. Durch dieses Zeigen lenkt man die Aufmerksamkeit darauf und 
macht es prominenter, und unterstreicht somit, dass die Aussage tatsächlich zu- 
trifft (vgl. Wiemer 2017: 11: „visual evidence counts as most reliable, if not as 
proof“). Die Wahrheitsmarkierung der Partikel wird also durch die gestische Auf- 
merksamkeitssteuerung unterstützt: Mit einem konkreten referentiellen Deikti- 
kum auf etwas zeigen ist nur möglich, wenn es das tatsächlich (vor Ort) gibt. 

Das nachstehende Beispiel enthält die Partikel eben in einer es gibt-Struktur. 
Für den Sprecher, ZDF-Hausgärtner Elmar Mai, liegt es auf der Hand, dass sich in 
der ganzen Kräutervielfalt einige besondere Kräuter finden lassen. Auch Leute, 
die sich in dem Bereich weniger gut auskennen, können das aber nicht leugnen, 
wenn sie diese besonderen Kräuter zu Gesicht bekommen. Das ist gerade hier der 
Fall: Es sind einige solche Kräuter aufgestellt worden, und das nützt der Sprecher 
auch aus. Er sagt, dass es besondere Kräuter gibt, und zugleich zeigt er darauf, 
d. h. lenkt die Aufmerksamkeit auf diese Kräuter. Könnte der Kräuterlaie die rein 
verbale Aussage theoretisch noch anzweifeln, so ist das schon schwieriger, wenn 
er das Gemeinte zu Gesicht bekommt und sieht, dass die Aussage stimmt. Indem 
der Sprecher auf das Gemeinte zeigt (so dass der Hörer es gewiss sieht), hebt er 
also die Wahrheit bzw. Evidenz seiner Aussage hervor, die auch durch die Parti- 
kel explizit markiert wird. Die Geste an sich ist also rein referentiell-deiktisch 
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bzw. aufmerksamkeitssteuernd, hat aber dadurch in Fällen wie diesem auch eine 
abtönungsunterstützende Wirkung. 


(1) FG_B1c 

803 EM also sag ich mal die äh die VIELfalt der 
kräuter war also auf der messe en 
wAhnsinnsthema, 

804 und es gIbt zum beispiel BAdekräuter, 

805 die man also ZIEhen kAnn- 

806 um sie quasi in die BAdewanne zu tun dann 
um en entspAnnungsbad zu kriegen, 

807 > {aber es GIBT eben auch ganz ungewöhnliche} 
kräÄlter- 

808 zum BEIspiel- 

809 proBIER doch einfach mal. 

810 IN das (--) das ist eine ERDbeermInze, 


Abb. 30: Konkretes referentielles Deiktikum mit eben 


Ähnlich ist die Situation in Beispiel (2), das der gleichen Pflanzenrubrik (al- 
lerdings in einer anderen Folge der Sendung) entstammt. In diesem Auszug ist 
von der Pflege von Palmen die Rede. Nachdem über das Gießen und Düngen ge- 
sprochen wurde, wechselt der Moderator (IN) in Einheit 858 das Thema und 
spricht jetzt über die Erde, die man für Topfpalmen verwenden sollte. Auf dem 
Tisch vor den Sprechern (allerdings infolge der Pflanzen im Bild schwer zu sehen) 
stehen einige Schalen mit unterschiedlichen Arten von Erde, die man für die Pal- 
menhaltung verwenden kann. Während er sagt, dass der Hausgärtner mehrere 
Arten von Erde mitgebracht hat, zeigt der Moderator mit seinen Kärtchen auch 
auf diese Schalen. Die Geste ist also an erster Stelle referentiell (sie zeigt die Re- 
ferenz von hier und so ein paar Varianten für die Erde an), aber indem sie die Auf- 
merksamkeit auf diese Schalen mit Erde lenkt, unterstreicht sie auch das Zutref- 
fen der Aussage, dass diese Erdproben mitgebracht worden sind. 
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(2) FG_Bla 

857 E also mit dem (.) gIEßen muss ich also SEHR 
aufpassen; 
858 IN > {du hAst uns ja hier auch mal so ein paar 
variAnten für die ERde mitgebracht, } 


859 E JA. 

860 I das GEHT von, 

861 wAs ist das [so RINde oder, 
862 EM [also dAs ist 
863 dAs ist orchiDEENsubstrat- 
864 dAs ist KlIEfernrinde, 


j i 
Abb. 31: Konkretes referentielles Deiktikum mit ja 


Interessant ist, dass in diesem Beispiel mit der ja-Äußerung, die von der Zei- 
gegeste begleitet wird, zugleich ein thematischer Übergang geleistet wird. Das 
erinnert an die Funktion einer Partikel aus Cluster 1, eigentlich, die gerade dazu 
eingesetzt wird, in Fragen den Übergang zu einem anderen Thema bzw. zu einem 
anderen Aspekt des Themas zu markieren. In der Literatur wurde schon sugge- 
riert (u. a. von McNeill/Levy 1993: 365), dass bei Themenwechseln vielfach mehr 
gestikuliert wird. Bestimmte Gesten scheinen jedoch in diesem Zusammenhang 
häufiger vorzukommen, darunter die referentiellen Zeigegesten. 

Die Funktion der Zeigegeste an sich ist in Fragen mit eigentlich dieselbe wie 
in den Assertionen in (1-2): die Aufmerksamkeit des Hörers auf einen Referenten 
zu lenken und diesen so prominenter zu machen. Der Referent, der während ei- 
ner eigentlich-Frage angezeigt wird, ist dann typischerweise das neue Thema 
(ähnlich, wie das auch in (2) der Fall war). Indem auf das neue Thema gezeigt 
wird, wird es also nicht nur identifiziert, damit darüber schon mal kein Zweifel 
bestehen kann: Zugleich wird es auch hervorgehoben als das neue Thema der 
Äußerung. Die Geste erhöht mit anderen Worten die Prominenz des neuen The- 
mas und unterstreicht so nochmals den Themenwechsel, der auch schon auf ver- 
baler Ebene durch eigentlich markiert wird. 
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Beispiel (3) entstammt ebenfalls einer Folge der Fernsehsendung Volle 
Kanne. In dieser Folge ist Fernsehkoch Horst Lichter (HO) der Studiogast. Da es 
sich um ein Morgenmagazin handelt, ist man auf die Idee gekommen, dass er 
auch etwas zum Frühstück kocht, und zwar ein Rührei. Während er damit be- 
schäftigt ist, geht das Gespräch mit dem Moderator (IN) weiter, und sie kommen 
zum Thema der Morgenrituale. In diesem Auszug beschreibt Lichter den Ablauf 
seines Morgens. Danach kehrt der Moderator zum Thema ‚Rührei‘ zurück, und 
zwar stellt er eine Frage zu einer bestimmten Zutat, den Champignons. Zugleich 
richtet er auch eine Zeigegeste auf die Champignons (Abbildung 32) und lenkt so 
die Aufmerksamkeit darauf. Mit dieser Geste identifiziert er die Champignons 
nicht nur als das Gemeinte, sondern macht sie auch prominenter und unter- 
streicht also den Themenwechsel, den er auch schon auf verbaler Ebene mit der 
Partikel eigentlich markiert. 


3) FG_B1c 
081 HO also so um nEUn uhr werd ich WACH eigentlich, 
082 oKAY- 
083 dann stEh ich AUF, = 
084 =aber dann brAUch ich ne GUte stunde; 
085 ich brAUch KAFfee, 
086 ich brAUch e lecker BRÖTchen, 
087 ich brAUch e bisschen LEberwust, 
088 wat SÜßes dabEI, 
089 viellElIcht so lecker RÜHRei, 
090 dAt is schon oKAY, 
091 und dAnn werd ich so GANZ langsam wach ja, 
092 dann geh ich so noch mal kurz in die 
porzelLANausstellung die wElt behErrschen, 
093 danAch gehste DUSchen, 
094 ANziehen, 
095 und dAnn bin ich FITT; 
096 ne [stUnde BRAUCH ich. 
097 IN [dann 
098 DANN kann s 1lOsgehen; 


099 HO jA; 

100 IN > ähm tu{st du jetzt eigentlich die 
chAmpignons, 

101 um nochmal aufs RÜHRei zurückzukommen; 

102 ERST} rein und dann, 

103 HO ERST. 

104 die kommen jEtzt schnell mit REIN? 
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Abb. 32: Konkretes referentielles Deiktikum mit eigentlich 


In diesem Beispiel liegt eine konkrete Zeigegeste vor. Obwohl es im Korpus 
nicht belegt ist, scheint es jedoch nicht ausgeschlossen, in solchen Fällen mit ei- 
gentlich auch abstrakte Deiktika einzusetzen, indem man in der Richtung zeigt, 
in der der Referent des neuen Themas zu finden ist. In Assertionen mit einer Par- 
tikel der Cluster 2a/b liegt dies weniger auf der Hand, da die Verwendung eines 
Deiktikums zum Beweis des Zutreffens des Sachverhaltes voraussetzt, dass der 
Sachverhalt auch sichtbar ist, was bei abstrakten Zeigegesten eben nicht der Fall 
ist. Die Annahme, dass bei eigentlich durchaus abstrakte Deiktika vorkommen 
können, bleibt aber weiter zu verifizieren. 

Zum Schluss stellt sich noch die Frage, ob die referentiellen Zeigegesten 
diese abtönungsunterstützende Wirkung auch aufweisen können, wenn keine 
verbale Abtönung vorliegt. Beispiel (4) legt nahe, dass dies tatsächlich möglich 
ist. 


(4) FG_Bla 
1031 IN willkommen zurück bei deutschlands 
erfolgreichstem FERNsehvormittag, 


1032 ne RANDvolle halbe stunde hAben wir noch; 

1033 zusammen mit einem BEStens gelaunten 
frühstücksgast, 

1034 > mi{ke KRüger ist bEI} uns; 


Dieser Auszug enthält die ersten Äußerungseinheiten des zweiten Teils einer 
Folge von Volle Kanne, in denen der Moderator (IN) die Zuschauer wieder will- 
kommen heißt und nochmals andeutet, wer der Studiogast ist. Während er an- 
kündigt, dass Mike Krüger der Frühstücksgast ist, zeigt IN kurz aufihn und wen- 
det auch kurz den Blick von der Kamera ab, hin zu Mike Krüger. Die Zeigegeste 
dient also der Identifizierung von Mike Krüger, aber auch in diesem Fall könnte 
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man behaupten, dass durch die Aufmerksamkeitssteuerung zugleich auch das 
Zutreffen der Aussage hervorgehoben wird. 

Im Hinblick auf diese Beobachtung dürfte die Bezeichnung abtönungsunter- 
stützend als etwas irreführend erscheinen. Tatsächlich liegt in (4) keine verbale 
Abtönung vor, die durch die Geste unterstützt werden könnte. Streng genommen 
ist die Geste also als die einzige Ausdrucksform der für Cluster 2a/b konstitutiven 
Wahrheitsbedeutung zu sehen. Trotzdem werden die referentiellen Zeigegesten 
nicht zu den abtönenden Gesten gezählt, und zwar aus dem Grund, dass die ei- 
gentlichen abtönenden Gesten an sich rein abtönend sind, während die abtö- 
nungsunterstützenden Gesten außerdem eine andere Funktion haben, durch die 
der Abtönungseffekt erst erzielt wird. Tatsächlich wirken die referentiellen Zeige- 
gesten an erster Stelle immer noch referentiell-deiktisch; die abtönende Wirkung 
ist einer der Effekte, der mittels der Geste erreicht wird, ähnlich wie Referenzi- 
dentifizierung, Aufmerksamkeitssteuerung u. dgl. Die Geste an sich bleibt also 
referentiell-deiktisch und unterscheidet sich in der Hinsicht von den rein abtö- 
nenden Gesten, in denen eine dermaßen konkrete Funktion höchstens durch Per- 
sistenz nachzuweisen ist (vgl. Kapitel 13). 


10.2 Illokutionstypbezogene Gestik 


Den abtönenden und den abtönungsunterstützenden Gesten ist also gemeinsam, 
dass sie sich auf die abtönende Wirkung der Modalpartikeln beziehen. Dies ist 
jedoch nicht die einzige Bedeutungsfacette der Partikeln: Wie zweiten Kapitel 
dargelegt wurde, weisen sie darüber hinaus eine konnektierende Wirkung und 
einen Bezug zum Illokutionstyp auf. Aufgrund ihrer Bedeutung sind die einzel- 
nen Modalpartikeln jeweils nur in bestimmten Illokutionstypen einsetzbar, und 
dementsprechend sind Modalpartikeln auch ein Indiz dafür, mit welchem Illoku- 
tionstyp man es zu tun hat. 

Dieser Bezug auf den Illokutionstyp ist auch bei bestimmten Gesten nachzu- 
weisen. Konkret handelt es sich um Gesten, die auf der sogenannten ‚Conduit‘- 
Metapher (Reddy 1979) beruhen.’ Durch diese Metapher wird Interaktion (Aus- 
tausch von Gedanken) als ein Austausch von konkreten Objekten dargestellt. Die 
Worte oder Äußerungen werden also als Objekte oder Behälter (‚Conduits‘) vor- 
gestellt, deren Inhalt es zu vermitteln gilt. Auf verbaler Ebene findet man diese 


1 Im Deutschen wird diese Metapher gelegentlich auch als die Containermetapher (u. a. Bohle 
2007), die Röhrenmetapher (u. a. Surmann 2005) oder die Rohrpostmetapher (u. a. Kohl 2007) 
bezeichnet. 
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Metapher in Bildern wie leere Worte und hohle Phrasen (ohne Inhalt heißt hier 
also: ohne sinnvolle Bedeutung), aber auch gestisch wird diese Metapher reali- 
siert. 

Konkret sind im Hinblick auf die abtönungsliierte Gestik zwei Bereiche zu 
unterscheiden: das Geben von Informationen und das Bitten um Informationen. 
Dies stimmt mit den beiden Illokutionstypen ‚Assertion‘ und ‚Frage‘ überein. Im 
ersteren Fall wird die Information (bzw. der Inhalt der Äußerung) gestisch wie 
ein konkretes Objekt angeboten, im letzteren wird sie gestisch ‚erbettelt‘ (vgl. Bei- 
spiele unten). Es ist mit anderen Worten die Art der Vermittlung der Information 
im Illokutionstyp (bzw. der Illokutionstyp selber), die gestisch dargestellt wird. 
Eine direkte Beziehung zur eigentlichen, abtönenden Bedeutung der Modalparti- 
keln ist also nicht nachweisbar; vielmehr ist diesen ‚Conduit-Gesten‘ und den Mo- 
dalpartikeln gemeinsam, dass sie beide den Illokutionstyp der Äußerung, die sie 
begleiten, unterstreichen. In der Hinsicht ließe sich vielleicht einwenden, dass 
statt von einer direkten Korrelation zwischen diesen Gesten und den Modalparti- 
keln vielmehr von einer doppelten Korrelation mit dem Illokutionstyp (also 
Geste-Illokutionstyp und Partikel-Illokutionstyp) auszugehen wäre. Dies ändert 
jedoch nicht daran, dass durch diese doppelte Korrelation mit dem Illokutionstyp 
immerhin eine interessante Beziehung zwischen den Gesten und den Partikeln 
nachzuweisen ist, die aufgrund der illokutionstypbezogenen Natur der Modal- 
partikeln für vorliegende Arbeit durchaus relevant ist. 

Dadurch, dass sich diese Gesten allgemein auf den Illokutionstyp beziehen 
und nicht auf konkrete abtönende Facetten einzelner Partikeln, sind sie nicht so 
direkt mit konkreten Partikeln zu verknüpfen: Die illokutionstypbezogenen Ges- 
ten kookkurrieren mit allen analysierten Partikeln, sodass an dieser Stelle keine 
konkreten Kookkurrenzmuster im Einzelnen besprochen werden sollen. Viel- 
mehr soll ganz allgemein dargelegt werden, wie diese Gesten als Illokutionstyp- 
markierer agieren; auf ihren konkreten Stellenwert bei der Distribution der abtö- 
nungsliierten Gesten soll in den folgenden Kapiteln (insbesondere Kapitel 12) 
ausführlicher eingegangen werden. 

Im Großen und Ganzen lassen sich bei den assertionsbezogenen Gesten (min- 
destens) drei Realisierungsformen unterscheiden, die allerdings nicht immer klar 
voneinander abzugrenzen sind. Diesen liegen Conduit-Varianten zugrunde, die 
im Folgenden als bietend, auspackend und hinstellend bezeichnet werden. Der 
erste Typ ist der bislang am eingehendsten studierte: Mehrere Forscher (u. a. Mül- 
ler 2004 und Streeck 2007) haben dieses Gestikmuster schon besprochen, aller- 
dings nicht immer mit Verweis auf die Conduit-Metapher. Der bietende Conduit 
ist eine der Verwendungen der sogenannten ‚Palm Up Open Hand‘ (kurz: PUOH): 
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Der Sprecher hält die Hand? (flache Hand oder Schüsselhand), mit der Handflä- 
che nach oben gerichtet und den Fingern vom Körper weggewandt, meist auf El- 
lenbogenlänge vor sich hin, typischerweise im Zentrum des Gestenraums (,cen- 
ter‘ oder ‚center-center‘), oder aber auf gleicher Höhe in der Peripherie. So bildet 
er mit der Hand eine Art von Schüssel oder Serviertablett, auf dem der Inhalt der 
Äußerung dem Hörer angeboten wird. 


(5) PR_Schü2911 


125 WS und dEswegen habe ich mit äh es pee ö 
vorsitzendem gusenbauer auch verEINbart, 

126 damit das °h außer STREIT gestellt wIrd, 

127 dass wir über diese frage GUTachten 
EInholen, 

128 und es ist äh der verfAssungsdienst (.) des 
BUNdes; 

129 > {der ja eine} °h wie sie wIssen zwar nicht 
for!MELL! weisungsfreie behörde ist, 

130 aber de fActo einen ganz besonderen STAtus 
hat innerhalb des bundeskanzleramtes, 

131 KEIN bundeskanzler- 

132 auch ICH nicht, 

133 würd s wAgen oder auch nur verSUchen etwa, 

134 seine perSÖNliche rechtsmeinung (--) dem 


verfassungsdienst äh vOrzugeben; 


Abb. 33: Assertiv-bietende Geste 


Die zweite Variante, die als auspackend bezeichnet wird, ist eng mit der bie- 
tenden verwandt. Tatsächlich nehmen die Hände am Ende dieser Geste vielfach 
die gleiche Position ein wie bei der bietenden Variante. Typisch für die auspa- 
ckende Variante ist allerdings die Bewegung, die zu dieser Handhaltung führt: 


2 Alle in diesem Abschnitt zu besprechenden Gesten können einhändig wie zweihändig reali- 
siert werden. 


188 — Weitere abtönungsliierte Gesten 


eine Drehbewegung, die dem Öffnen einer Verpackung ähnelt.” Während der 
Sprecher die Information mitteilt, packt er sie also gestisch aus, damit der Hörer 
sie sehen und gegebenenfalls annehmen kann. 


(6) FG_Bib 
828 IN schö:nes kind GUtes kind, 
829 jetzt gEhts um SÄFte, 
830 > die sOllen ja {so geSUND sein ne}? 
831 multivitaMINsäfte; 


Abb. 34: Assertiv-auspackende Geste 


Die dritte Realisierungsvariante unterscheidet sich deutlicher von den bei- 
den anderen. In diesem Fall stellt der Sprecher die Äußerung gestisch in den 
Raum vor sich hin, damit der Hörer so Zugriff auf sie hat. Typischerweise wird 
diese Variante ebenfalls mit der flachen Hand realisiert, allerdings ist die Hand- 
fläche dem Zentrum des Gestenraums zugewandt. Erneut wird die Geste typi- 
scherweise auf Ellenbogenlänge im Zentrum des Gestenraums realisiert. 


(7) PR_West3010 
100 WE und am ENde, 


TO INklusive °h des bawag-skandals mit drEI 
milliarden, 

102 kommt man auf die Unglaubliche schAdenssumme, 

103 soziAldemokratischer WIRTschaftspolitik, 

104 von zwölf milLIARden euro; 


3 Ferré (2012: 5) bezeichnet die PUOH als ‚hand flip‘ und suggeriert also, dass diese Drehbewe- 
gung immer Teil der PUOH sei. Obwohl es tatsächlich vielfach der Fall sein dürfte, dass die Hand 
gedreht werden muss, um die PUOH-Haltung zu erreichen, hat Streeck (2007: 158) gezeigt, dass 
die Drehbewegung kein konstitutiver Teil der bietenden Geste ist. Zudem ist die Ausgesprochen- 
heit der Drehbewegung unterschiedlich, was sich im Unterschied zwischen der bietenden und 
der auspackenden Variante widerspiegelt. Gerade die Tatsache, dass die Vorbereitungsphase 
der bietenden Variante vielfach eine Drehbewegung enthält, ist jedoch ein wichtiger Grund da- 
für, dass die einzelnen Varianten nicht immer klar voneinander abzugrenzen sind (vgl. oben). 
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105 oder ACHTzigtausend Arbeitsplätze, 

106 die sIE verNICHtet haben, 

107 wie SIE (-) wirtschaftspolitische 
verAntwortung getragen haben; 

108 > {das !SCHREIT! ja nach Aufklärung, } 


Abb. 35: Assertiv-hinstellende Geste 


Die Ergründung des genauen Verhältnisses dieser drei Varianten bleibt je- 
doch ein Forschungsdesiderat. Man könnte annehmen, dass die hinstellende Va- 
riante etwas stärker ist und dementsprechend der Äußerung (bzw. der Botschaft) 
mehr Nachdruck verleiht. Diese Annahme beruht auf die Art der Bewegung: Die 
hinstellende Bewegung ist auch als eine Art von einfachem Beat zu sehen, und 
die Funktion von Beats ist gerade das Erhöhen der Prominenz bzw. das Unter- 
streichen der Relevanz des Gesagten. Dies ist allerdings nur eine Hypothese, die 
noch weiterer Erforschung bedarf. Auch die Kombinierbarkeit mit anderen Ges- 
ten dürfte für die Distribution der drei Varianten eine Rolle spielen: Aufgrund der 
Orientierung (‚PUOH‘) ähneln die bietende und die auspackende Variante den 
intersubjektiven Zeigegesten, sodass sie sich auch leicht damit kombinieren las- 
sen (s. Abschnitt 10.3), während die Kombination mit einer Taktstockgeste eher 
mit der hinstellenden Variante anbietet, und zwar aufgrund der bereits angespro- 
chenen inhärenten beatähnlichen Bewegung dieser Variante (obwohl auch die 
beiden anderen Varianten mit einem Beat kombiniert werden können). Hier 
dürfte auch die Erklärung dafür liegen, dass die hinstellende Variante in den Par- 
lamentsreden verhältnismäßig häufiger eingesetzt wird als in den Fernsehdaten‘ 
(48,81% der assertionsbezogenen Gesten in den Parlamentsdaten sind hinstel- 
lend, gegenüber 30,69% in den Fernsehdaten), da in Parlamentsreden dem Ge- 
sagten häufiger Nachdruck verliehen wird (auch Beats im Allgemeinen werden 


4 Zwischen der bietenden und der auspackenden Variante findet sich weder in den Fernsehda- 
ten noch in den Parlamentsdaten ein deutlicher Frequenzunterschied. 
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in den Parlamentsreden häufiger eingesetzt als in den Fernsehdaten, vgl. Kapitel 
12). Klare Tendenzen im Hinblick auf die Frage, ob mit bestimmten Modalparti- 
keln eher bestimmte ‚Conduit‘-Varianten einhergehen, lassen sich in den Daten 
nicht nachweisen. 

Zum Schluss sei noch auf die Verwendung der conduitbasierten Gesten in 
Fragen eingegangen. In diesem Fall ist die Situation wesentlich einfacher, da 
(wenigstens im Korpus) in Fragen nur eine Variante nachzuweisen ist: die bit- 
tende. Dabei handelt es sich um die fragende Nebenform der bietenden Variante. 
Streeck (2007) hat schon darauf hingewiesen, dass die gleiche Handform mal als 
„bietende Hand“ und mal als „bittende Hand“ zu interpretieren ist. Formal ist die 
bietende Variante von der bittenden nicht eindeutig zu unterscheiden, und man 
braucht den Kontext, um zu wissen, ob Information geboten oder erbettelt wird. 
Tatsächlich sieht diese Geste fast wie Betteln aus: Die Hand wird wieder wie eine 
Schüssel ausgestreckt, diesmal aber nicht, damit der Hörer die Information sehen 
bzw. abnehmen kann, sondern damit der Hörer die erbetene (‚erbettelte‘) Infor- 
mation darauflegt. 


(8) PR_Cap3010 

243 CA und bis dorthIn wirds ZWIschenfinanziert von 
der pee es kaa von der hausbank, 
244 und dAnn zahln mer die RAten zruck, = 
245 =so!WOHL! (.) äh für den eurofighter als auch 
an die p °h an die pee es kaa die die 
zwIschenfinanzierung vorgenommen hat. 


246 > {was KOStet so was eigentlich so a 
zwIschenfinanzierung; 

247 san des ZWANzig millionen EUro, 

248 DREIßig millionen EUro, 

249 SAgen sie} mir das blItte; 


Abb. 36: Bittende Geste 
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Eine alternative Interpretation der PUOH in Fragen ist jene der Rederecht- 
übergabe. Demzufolge wäre die bittende Geste mit der bietenden gleichzusetzen, 
denn in den beiden Fällen würde auf der Hand-als-Schüssel dem Hörer etwas an- 
geboten (Information oder das Rederecht). Auf eine solche Interpretation der 
PUOH hat auch Bohle (2007: 132) schon hingewiesen. Auch wenn eine solche Ver- 
wendung der PUOH durchaus nicht auszuschließen ist, scheint es doch wertvoll, 
diese von der bittenden Conduit-Geste zu unterscheiden (obwohl dieser Unter- 
schied nicht immer gleich leicht fallen dürfte). Zwar wird auf eine Frage typi- 
scherweise gleich eine Antwort erwartet, und in der Hinsicht ließe sich die bit- 
tende Geste tatsächlich auch als eine rederechtübergebende interpretieren: 
Wenn man um Informationen bittet, so fordert man typischerweise den Ge- 
sprächspartner auf, das Rederecht zu übernehmen und diese Informationen zu 
liefern. Allerdings ist eine Rederechtübernahme nicht immer gleich möglich. Bei- 
spiel (8) etwa entstammt einer Parlamentsrede, das heißt gerade einem Kontext, 
in dem gar keine Rederechtübergabe stattfindet (außer am Ende der Rede, was 
aber in (8) nicht der Fall ist). Zudem kann die Geste (wie auch in (8)) mehrere 
Äußerungseinheiten lang gehalten werden kann, während eine Rederechtüber- 
gabegeste wohl eher gegen Ende der Äußerung (also mit der letzten Äußerungs- 
oder Intonationseinheit) zu erwarten wäre.’ Aus diesen zwei Gründen wird in vor- 
liegender Arbeit immerhin von einer Verwendung der PUOH als bittender 
Conduit-Geste ausgegangen.“ 


10.3 Kombination der Dimensionen 


Wenn im vorliegenden Kapitel von drei Dimensionen (abtönend, abtönungsun- 
terstützend, illokutionstypbezogen) im Verhältnis von Gestik und verbaler Abtö- 
nung die Rede ist, so hat das einen guten Grund. Im dritten Kapitel wurde bereits 
darauf hingewiesen, dass McNeill (2005) seine Gestenklassen ebenfalls als Di- 
mensionen konzipiert, weil eine Geste auf mehreren dieser Dimensionen zu- 
gleich anzusiedeln sein kann. Das Gleiche gilt auch für die drei im vorliegenden 
Kapitel relevanten Dimensionen: In einem komplexen Gestikmuster können zu- 
gleich mehrere dieser drei Dimensionen vertreten sein. 


5 Allerdings steht eine genaue Bestimmung des Timings von Rederechtübergabegesten noch 
aus. 

6 Es wäre andererseits auch möglich, die PUOH-Rederechtübergabegeste einfach als bittende 
Geste zu sehen, auch wenn sie nicht mit einer Frage einhergeht. Impliziert ist dann eine Bitte um 
die Ansicht des Hörers, um eine Ergänzung vonseiten des Hörers usw. 
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Auf ein solches Beispiel wurde im vorigen Abschnitt schon hingewiesen: die 
Kombination einer illokutionstypbezogenen Geste und einer Taktstockgeste. Tat- 
sächlich dürfte diese bei der hinstellenden Variante der assertionsbezogenen 
Geste inhärent anwesend sein, kann aber prominenter gemacht werden, indem 
die hinstellende Bewegung beatartig wiederholt wird. Allerdings kann der Beat 
vielen Gesten (u. a., aber nicht nur, den anderen illokutionstypbezogenen Ges- 
ten) als zusätzliche Schicht aufgelegt werden (vgl. Kapitel 3). Wenn diese Geste, 
die mit einem Beat versehen wird, selber nicht abtönend wirkt, so sind in dem 
Gestikganzen zwei Dimensionen vertreten: die abtönende durch den Beat (aus- 
führlicher dazu Abschnitt 9.2) und die abtönungsunterstützende oder illokuti- 
onstypbezogene durch die andere Facette des Gestikmusters. 

Auch das intersubjektive Deiktikum kann mit einer anderen Geste zu einem 
‚größeren‘ Ganzen kombiniert werden. Wie bereits mehrfach angesprochen 
wurde, ist die typische Realisierungsform des intersubjektiven Deiktikums die 
PUOH, d. h. gerade eine der Formen, die auch eine assertionsbezogene Geste an- 
nehmen kann. Dementsprechend können die beiden Funktionen — abtönend 
(Konsensmarkierung) und illokutionstypbezogen (assertiv-bietend) - zugleich 
realisiert werden: Das Deiktikum markiert die auf der illokutionstypbezogenen 
Ebenen gebotene Information als nicht weiter zur Diskussion stehend. 

Die formale Ähnlichkeit hat auch ihre Auswirkungen auf die Interpretation 
der Gesten. So werde Müller (2004: 237) zufolge die bietende Geste auch verwen- 
det „to propose a common perspective on a presented object.“ Das ‚presented ob- 
ject‘ ist der Inhalt der Äußerung, der durch die Conduit-Metapher dem Hörer an- 
geboten wird, und die ‚common perspective‘ deutet auf das Einverständnis, das 
durch die intersubjektiv-deiktische Dimension der Geste markiert wird. Es zeigt 
sich also, dass sich in der PUOH-Geste durchaus die illokutionstypbezogene und 
die abtönende Dimension vereinen können. 

An dieser Stelle ist die Frage relevant, wie sich die einzelnen Gesten zueinan- 
der verhalten, d.h. ob tatsächlich die conduitbasierte illokutionstypbezogene 
Geste unabhängig vom Deiktikum selber auch eine solche intersubjektive Wir- 
kung aufweisen kann oder ob es sich doch vielmehr um zwei unterschiedliche 
Gesten handelt, die aufgrund der formalen Ähnlichkeit wie der funktionalen 
Kompatibilität leicht miteinander kombiniert werden können. Aufgrund der Tat- 
sache, dass die illokutionstypbezogene Geste nicht immer die intersubjektiv- 
deiktische Komponente enthält und umgekehrt, liegt die Vermutung nahe, dass 
letztere Analyse die Wahrscheinlichere ist. In diesem Zusammenhang kann er- 
neut auf Beispiel (6) hingewiesen werden, dass hier als Beispiel (9) wieder aufge- 
nommen wird. In diesem Beispiel liegt eine Kombination der beiden Dimensio- 
nen (illokutionstypbezogen und intersubjektiv-deiktisch) vor. Bemerkenswert 
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ist, dass in diesem Beispiel die assertiv-auspackende Geste zweihändig realisiert 
wird, während nur die rechte Hand (d. h. die Hand auf der Seite des Gesprächs- 
partners) zudem auf den Gesprächspartner gerichtet ist und die intersubjektiv- 
deiktische Komponente realisiert.’ 


(9) FG_Bic 
828 IN schö:nes kind GUtes kind, 
829 jetzt gEhts um SÄFte, 
830 > die sOllen ja {so geSUND sein ne}? 
831 multivitaMINsäfte; 


Abb. 37: Kombination der intersubjektiv-deiktischen und der illokutionstypbezogenen (asserti- 
ven) Dimension 


Es zeigt sich also, dass Kombinationen zweier Dimensionen (insbesondere 
der abtönenden und der illokutionstypbezogenen Dimension) durchaus möglich 
sind. Inwiefern auch Kombinationen abtönender Gesten untereinander möglich 
sind, soll im nächsten Kapitel eingehender besprochen werden. 


7 Tatsächlich sind auch in anderen Fällen die Finger bei einer assertiv-biedenden oder einer 
assertiv-auspackenden Geste ohne intersubjektiv-deiktische Komponente nicht immer direkt auf 
den Gesprächspartner gerichtet. Sie können auch schräg zur Seite oder leicht nach unten gerich- 
tet sein, was als einen weiteren Grund betrachtet werden kann, die beiden Dimensionen ausei- 
nanderzuhalten. 


11 Kombinatorik und Wiederholung 


11.0 Einführung 


Im einführenden Kapitel wurde bereits darauf hingewiesen, dass die Kombinato- 
rik und die Wiederholung von Modalpartikeln für ihre Übersetzung eine Rolle 
spielen können. Im Falle von Partikelkombinationen wird zum Beispiel vielfach 
nur eine der Partikeln übersetzt (meist die spezifischere bzw. diejenige mit der 
‚stärkeren‘ Bedeutung), und wenn eine Partikel in aufeinander folgenden Äuße- 
rungen wiederholt wird, so wird gelegentlich nur eine Instanziierung (meistens 
die erste) auch in die Zielsprache übertragen. 

Obwohl die gestische Vermittlung von Abtönungsbedeutungen nicht direkt 
auf einer Ebene mit deren Übertragung in eine andere Sprache zu sehen ist, stellt 
sich die Frage, ob die Resultate der Übersetzungsanalysen vielleicht allgemei- 
nere Tendenzen im Hinblick auf die Vermittlung von Abtönungsbedeutungen 
verdecken könnten, die auch bei deren gestischer Realisierung eine Rolle spielen, 
zum Beispiel im Hinblick auf die Frage, wie das gegenseitige Verhältnis zwischen 
den Partikeln in einer Kombination konzeptualisiert wird. Des Weiteren lassen 
sich bei Partikelwiederholungen Fragen im Hinblick auf das Verhältnis von ver- 
balen und gestischen Ausdrücken stellen, zum Beispiel wie lange eine Paarung 
von einem Wort mit einer Geste konstant bleibt und ob eines der gepaarten Ele- 
mente, wenn die Paarung einmal etabliert ist, das andere Element der Paarung 
wieder aufrufen kann. Im Hinblick auf solche Fragestellungen wird im Folgenden 
auf Aspekte der Kombination (11.1) und Wiederholung (11.2) von Abtönungsbe- 
deutungen eingegangen. 


11.1 Kombinatorik 


Wenn in diesem Kapitel von Kombinatorik die Rede ist, so ist damit das Kombi- 
nationsverhalten unterschiedlicher abtönender Bedeutungen gemeint. Dain der 
vorliegenden Arbeit die Kookkurrenzen von verbalen und gestischen Abtönungs- 
mitteln zentral stehen, ist auch die Kombinatorik nicht auf eine Ausdrucksebene 
beschränkt: Dass mehrere Abtönungsbedeutungen verbal zum Ausdruck ge- 
bracht werden können, zeigen zum Beispiel die traditionellen Partikelkombina- 
tionen, aber auch das gestische Vermitteln mehrerer Abtönungsbedeutungen 
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und das Kombinieren eines verbalen und eines gestischen Elementes, die unter- 
schiedliche Abtönungsbedeutungen vermitteln, ist nicht ausgeschlossen. 

Diese drei Möglichkeiten spiegeln sich im Aufbau der folgenden Bespre- 
chung wider. In einem ersten Schritt (11.1.1) wird die Frage gestellt, welche Aus- 
wirkungen eine Kombination mehrerer Abtönungsbedeutungen auf der verbalen 
Ebene (unter der Form einer Modalpartikelkombination) auf die Gestik hat. Nach- 
her wird auch die Kombinatorik selber auf die Ebene der Gestik erweitert bzw. 
verlagert, um der Frage nachzugehen, inwiefern es möglich ist, eine Abtönungs- 
bedeutung verbal und eine andere gestisch auszudrücken (11.1.2) oder gar meh- 
rere abtönungsliierte bzw. insbesondere abtönende Gesten miteinander zu kom- 
binieren (11.1.3). 


11.1.1 Partikelkombinationen 


Insgesamt werden im Korpus in 15 Fällen mehrere Partikeln der analysierten 
Cluster gemeinsam in einer Äußerungseinheit eingesetzt (Kombinationen mit 
weiteren Partikeln, etwa ja wohl oder denn schon, bleiben im Folgenden außer 
Betracht). Es handelt sich um elf geschlossene Kombinationen, d. h. Kombinati- 
onen, bei denen die Partikeln adjazent sind, und vier offene Kombinationen, bei 
denen andere Elemente zwischen den Partikeln geäußert werden. Bei nur insge- 
samt 15 Belegen ist eine gewisse Vorsicht geboten, aber in den Daten scheint die- 
ser Unterschied (offen/geschlossen) für die Kookkurrenz mit der Gestik keinen 
wesentlichen Unterschied auszumachen. 

Die 15 Belege im Korpus decken insgesamt sechs unterschiedliche Kombina- 
tionen ab, allesamt Zweierkombinationen, die nur aus Partikeln der Cluster 2a/b 
bestehen.' In drei Kombinationen kommen nur Partikeln des Clusters 2b vor - 
einfach eben (ein Beleg), halt eben (zwei Belege) und halt einfach (drei Belege) -, 
während in zwei anderen jeweils eine Partikel des Clusters 2a mit einer Partikel 
des Clusters 2b kombiniert wird - doch einfach (ein Beleg) und ja einfach (vier 
Belege). Die Kombination der beiden zentralen Partikeln des Clusters 2a, ja doch, 
ist ebenfalls viermal belegt. Bei acht der 15 Kombinationsbelege lässt sich eine 
abtönungsliierte Geste nachweisen; in drei der sieben weiteren Fälle ist ein exter- 


1 Kombinationen von Partikeln des Clusters 1 einerseits und der Cluster 2a/b andererseits sind 
alleine schon aufgrund der unterschiedlichen Satztypendistribution dieser Partikeln eher un- 
wahrscheinlich. Die Kombination der beiden zentralen Partikeln des Clusters 1, denn eigentlich, 
ist durchaus möglich aber im Korpus nicht belegt. 
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ner Faktor im Spiel, der die Realisierung einer Geste verhindern kann (vgl. Ab- 
schnitt 12.3; konkret handelt es sich hier um das Festhalten eines Objektes oder 
das Ausführen einer Handlung während des Sprechens). 

Oben wurde bereits darauf hingewiesen, dass bei der Übersetzung von Parti- 
kelkombinationen vor allem der Partikel mit der stärkeren bzw. spezifischeren 
Bedeutung Rechnung getragen wird. Im Hinblick auf die Frage, ob sich auch bei 
der gestischen Realisierung diese Partikel stärker zeigt, erscheinen vor allem die 
‚clusterübergreifenden‘ Kombinationen interessant, da die Evidenzbedeutung 
des Clusters 2b als eine stärkere bzw. spezifischere Variante der allgemeineren 
Wahrheits- bzw. Einverständnisbedeutung des Clusters 2a aufgefasst werden 
kann (vgl. Abschnitt 2.3.3). Allerdings ist nur ein einziger Beleg im Korpus in die- 
ser Hinsicht aufschlussreich, da drei der vier Belege von ja einfach nicht durch 
eine abtönungsliierte Geste begleitet werden und mit dem Einzelbeleg von doch 
einfach nur eine illokutionstypbezogene Geste einhergeht, die im Hinblick auf die 
abtönende Wirkung der Einzelpartikeln neutral ist. Einzig relevant ist der vierte 
Beleg von ja einfach (1), der tatsächlich mit einem Kopfschütteln und einem Ach- 
selzucken kookkurriert. Dies sind Gesten, die in den vorigen Kapiteln insbeson- 
dere mit der Partikel einfach in Bezug gesetzt wurden (obwohl auch auf deren 
Vorkommen mit ja hingewiesen wurde), sodass sich hier in der Tat vor allem die 
spezifischere Partikel in der Gestik zeigt. 


(1) FG_Alc 
2232 SF also es ist wIrklich phänomeNAL, = 
2233 =wenn man sieht dass die norweger mit VIER 
startern wirklich eins bis vIEr erreicht 
haben, 
2234 > also {das Ist ja einfach} (-) einfach 
wAHNsinn, 


Im Hinblick auf die Frage, ob sich die spezifischere Partikel auch stärker in 
der Gestik zeigt, könnte auch die Kombination der Partikeln des Clusters 2a (ja 
doch) interessant sein. Tatsächlich ist doch insofern spezifischer und stärker als 
ja, als es neben der auch durch ja vermittelten Wahrheits- bzw. Einverständnis- 
bedeutung zudem eine gewisse Adversativität mit sich trägt. Eine bestimmte 
Geste, die sich stärker als andere mit doch verknüpfen ließe, lässt sich im Korpus 
jedoch nicht finden, was auf die Vielfalt möglicher Verwendungen und Nuancen 
dieser Partikel zurückzuführen sein dürfte (vgl. Abschnitt 2.3.2). Neben der Bör- 
senhand und dem senkrechten Ring - zwei Gesten, die im Korpus eher selten sind 
und sowieso nur in bestimmten Kontexten mit deutlicher Adversativität einge- 
setzt werden können — wurde in den vorangehenden Kapiteln auch bei keiner 
einzigen Geste eine starke Tendenz zur Kookkurrenz mit doch nachgewiesen. 
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In dieser Hinsicht ist es auch nicht allzu verwunderlich, dass sich die spezi- 
fischere Bedeutung von doch in der Gestik bei Kombinationen mit ja im Korpus 
nicht deutlich zeigt. Allerdings ist anzumerken, dass in drei der vier Belege von 
ja doch die Gestik durch andere Faktoren wie das Halten eines Objektes unter- 
drückt wird. In dem einen Beleg, in dem durchaus eine Geste realisiert wird, han- 
delt es sich um ein intersubjektives Deiktikum. Das ist eine der Gesten, die auch 
bei doch als Einzelpartikel belegt sind, und es vermittelt auch einen Teil der Be- 
deutung von doch - allerdings gerade den Teil, der auch durch ja ausgedrückt 
wird (das Einverständnis). Damit liegt eine Geste vor, die durchaus mit den bei- 
den Partikeln der Kombination verträglich ist, sich allerdings nicht unbedingt 
eher an die spezifischere Partikel anlehnt. 


(2) FG_Bla 
048 IN zwWElIohrnase heißt die neue tOUr; 
049 da geht s dann im FEbruar äh richtig ans 
EIngemachte, 
050 bIste da schon en bisschen AUFgeregt, 
051 > weil Ist {ja doch nach (--)} zehn jahren 
PAUse glaub ich ne, 


Abb. 38: Intersubjektives Deiktikum mit ja doch 


Bei den Kombinationen von Partikeln des Clusters 2b ist es schwieriger, im 
Voraus festzulegen, welche Partikel die spezifischere bzw. die stärkere sein soll. 
Dementsprechend zeichnet sich in der Gestik auch keine klare Tendenz auf dieser 
Ebene ab. Die Gesten, die verwendet werden, sind jeweils mit den beiden Parti- 
keln kompatibel (wie auch zu erwarten wäre) und kommen mal häufiger mit der 
einen, mal häufiger mit der anderen Partikel vor, aber starke Präferenzen für Ges- 
ten der einen oder anderen Partikel scheint es nicht zu geben. So ist halt einfach 
einmal mit Nicken (3) und einmal mit Kopfschütteln (4) belegt. In Beispiel (3) er- 
zählt UB darüber, wie die Ärzte festgestellt haben, an welchen Erkrankungen ihre 
schwerstkranke (und mittlerweile verstorbene) Tochter litt: Zunächst hatte man 
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nur leichte Abweichungen gefunden, und erst später hat sich herausgestellt, dass 
sie tatsächlich todkrank war. Beispiel (4) enthält ein Auszug aus der Reaktion von 
Schifahrerin Maria Höfl-Riesch (MR) nach einem enttäuschenden Ergebnis bei 
der Weltmeisterschaft. Beide Sprecherinnen verwenden die Partikelkombination 
halt einfach, aber während UB gestisch vor allem das Zutreffen der Aussage her- 
vorhebt (durch das Nicken), verwendet MR das Kopfschütteln der impliziten Ne- 
gation (‚mehr ist nicht dazu zu sagen‘). Beide Gesten können mit beiden Parti- 
keln einzeln vorkommen, aber während sich das Kopfschütteln eher mit einfach 
verknüpfen lässt, zeichnet sich für das Nicken keine so deutliche Tendenz ab (vgl. 
Kapitel 8). 


(3) FG_B2a 
1647 RB haben die ärzte sOfort festgestellt dass 
[da en zuSAMmenhang ist, 


1648 UB [das ist 
1649 NEE. 
1650 das ist Immer en verDACHT im endeffekt, 


1651 RB mhm 

1652 UB weil sie da nicht auf äh hErzerkrankungen 
unterSUCHT wurde, 
1653 und dann Erst am nächsten tag in der KLInik- 
1654 > da: (-) hat man dann gemErkt dass {halt 
einfach noch VIEL viel mehr} war. 


(4) FG_A3b 

976 MR mei da brAUcht man jetzt einfach nix auf 
irgendwas SCHIEben, 

977 ich bin im Endeffekt selber SCHULD gewesen; 

978 ich bin s nicht so gfahren wie man s hätte 
fahren MÜSsen um da (.) vOrne dabei zu sein, 

979 ich bin einfach wie gesagt äh von der 

980 ich WEIß nicht genau; 

981 ich hAb eigentlich geWUSST, 

982 es gibt spUren und ich muss von HINten 
drauffahren, 

983 das hAb ich verSUCHT, 

984 > aber °h dadurch dass mir dann so frÜh der 
fehler passiert (.) ist {bin ich halt einfach 
über}haupt nicht in=en rhythmus REINgekommen; 

985 aber das jetzt auf irgendwas anderes zu 


schieben das wäre total BLÖD, 


2 Theoretisch könnte sich das Kopfschütteln in diesem Beispiel auch auf die Negation in Einheit 
984 beziehen. Aufgrund des Timings und der Subtilität der Geste ist die Interpretation als abtö- 
nendes (und nicht als negierendes) Kopfschütteln jedoch m. E. die wahrscheinlichere. 
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986 ich bin wirklich sElber (--) SCHULD dran, 
987 und äh Ärgere mich hauptsächlich über mich 
SELber. 


Interessant ist gewiss auch das nächste Beispiel, in dem Heinz-Christian Stra- 
che für mehr Berücksichtigung von Volksbegehren im Parlament plädiert und da- 
bei die offene Kombination einfach eben verwendet. Bei den beiden Partikeln 
handelt es sich um objektive Modalität im Sinne von Verstraete (2001), d. h. um 
Eigenschaften, die einem Objekt (in diesem Fall dem Begehren) inhärent ange- 
hören, und die mithin den kontextverschobenen Fällen nahe stehen. Wichtiger 
ist aber an dieser Stelle, dass die Geste (eine ‚Palm lateral‘) auch zweimal reali- 
siert wird, einmal mit jeder der beiden Partikeln. Es ist schwer zu sagen, ob hier 
zweimal eine Geste zu der ganzen Kombination realisiert wird, oder je eine Geste 
zu jeder der beiden Partikeln, die sich dann als die gleiche herausstellt, denn tat- 
sächlich ist die PL auch bei den beiden Einzelpartikeln belegt. Das Beispiel zeigt 
aber deutlich, dass mit einer Partikelkombination nicht unbedingt nur ein Gestik- 
beleg einhergeht (zu beachten ist allerdings, dass es sich um eine offene Kombi- 
nation handelt; bei einer geschlossenen Kombination ist diese Realisierung 
zweier Gesten schon alleine aufgrund der Realisierungsdauer der Gesten schwie- 
riger, wenn sie mit den jeweiligen Partikeln zu überlappen haben). 


(5) PR_Strac2911 


048 HS und dArüber sollten wir uns gedanken machen 
und net (.) sozusagen GLAUben, 

049 nach einer wAhl kann man vier jahre hier tun 
und lassen was man WILL-= 

050 =und ansOnsten (--) lässt man den bürger am 
besten gar nicht MITsprechen; 

051 das ist der fAlsche WEG, 

052 und da werden wir uns auch wEIterhin (.) auch 
STARK machen. 

053 > wir wOllen (.) natürlich auch festmachen dass 
ein volksbegehren nicht {einfach am ende 
einer periode (.)} {eben AUSläuft-} 

054 so wie das bIsher der FALL ist. 

055 das hAt net AUSzulaufen. 


Festzuhalten bleibt also, dass Gesten, die mit einer Kombination von Modal- 
partikeln kookkurrieren, auch mit den einzelnen Partikeln dieser Kombination 
kompatibel sein müssen. Dies war im Grunde genommen zu erwarten: Wenn die 
Nuancen, die durch die einzelnen abtönenden Elemente (seien sie verbal oder 
gestisch) vermittelt werden, nicht miteinander verträglich sind, entsteht eine wi- 
dersprüchliche Äußerung. Allerdings soll dies nicht heißen, dass die Geste mit 
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den beiden Partikeln gleich eng verbunden sein muss: Solange die Geste mit den 
beiden Einzelpartikeln kompatibel ist, ist es nicht problematisch, wenn sie mit 
einer Geste häufiger vorkommt oder eine größere funktionale Übereinstimmung 
aufweist. Dementsprechend liegt die Vermutung nahe, dass sich die Gestik eher 
bei der von der Bedeutung her spezifischeren bzw. ‚stärkeren‘ Partikel an- 
schließt. Dies wäre auch im Einklang mit der im nächsten Kapitel weiter zu be- 
sprechenden Beobachtung, dass Partikeln mit einer stärkeren Bedeutung ohne- 
hin häufiger mit abtönenden Gesten kombiniert werden. 


11.1.2 Partikel-Geste-Kombinationen 


Im vorigen Abschnitt wurde der Frage nachgegangen, welche Auswirkungen 
eine Kombination abtönender Bedeutungen auf verbaler Ebene auf die Gestik 
hat. Allerdings stellt sich auch die Frage, inwiefern es möglich ist, Abtönungsbe- 
deutungen auf unterschiedlichen Ausdrucksebenen zu kombinieren. Konkret 
handelt es sich also um Kookkurrenzen von Partikeln und Gesten, bei denen die 
Geste von der Bedeutung her zwar nicht mit der Partikel inkompatibel ist (sonst 
wäre die Kookkurrenz wohl eher unwahrscheinlich), aber dennoch eine Bedeu- 
tung vermittelt, die eher mit einer anderen, in der Äußerung nicht vorhandenen 
Partikel zu verknüpfen wäre. 

Im Abschnitt 7.3.1 wurde bereits auf einen solchen Fall hingewiesen: die 
Kombination der Partikel ja mit der typischen einfach-Geste, dem Kopfschütteln. 
Allgemeiner handelt es sich bei den im Korpus belegten Partikel-Geste-Kombina- 
tionen, ähnlich wie bei den im vorigen Abschnitt besprochenen Partikelkombi- 
nationen, nur um Situationen, in denen sowohl die Geste als auch die Partikel 
mit den Clustern 2a/b zu verknüpfen sind. 

Relevant sind für die vorliegende Analyse an erster Stelle die Fälle, in denen 
die Geste der Äußerung eine abtönende Nuance verleiht, die auf der verbalen 
Ebene nicht explizit ausgedrückt wird. Am deutlichsten sind in dieser Hinsicht 
die Belege, in denen ja mit einer Geste kombiniert wird, die sich eher mit doch 
oder einer Partikel des Clusters 2b verknüpfen lässt, wie in der Kombination von 
ja und Kopfschütteln. Das nachstehende Beispiel (6) enthält einen weiteren Beleg 
dieser Kombination, in dem zugleich auch ein Achselzucken vorliegt. In diesem 
Beispiel besagt Thekla Carola Wied (TW), dass sie durch ihre Arbeit als Film- 
schauspielerin eine öffentliche Figur ist. Diese Aussage markiert sie verbal (durch 
die Partikel ja) als wahr bzw. bekannt, aber gestisch geht sie einen Schritt weiter 
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und markiert durch das Kopfschütteln und das Achselzucken, dass es ihrer Mei- 
nung nach gar als evidente Tatsache auf der Hand liegt, dass Filmschauspie- 
ler(innen) öffentliche Figuren sind. 


(6) FG_B2a 
2 RB sie TREten nur selten AUf- 
713 gEben nur selten interVIENS, 
4 


za waRUM scheuen sie so das licht der 
Öffentlichkeit frau wied. 

715 TW naja (.) ich schEU es ja nicht WIRKlich-= 

716 > =weil (.) durch die fIlme äh {BIN ich ja im 


licht der öffentlichkeit, } 

717 RB JA; 

718 TW und ich dEnke auch immer dass ich mich da 
°h am BESten ausdrücken kann, 


Insgesamt enthält das Korpus 50 Belege, in denen ja mit einer solchen Geste 
kombiniert wird (neben dem Kopfschütteln und dem Achselzucken handelt es 
sich auch um PL, ZP, Börsenhand, senkrechter Ring und Beat sowie Kombinatio- 
nen dieser Gesten untereinander und mit dem intersubjektiven Deiktikum oder 
dem Nicken). Bei 178 Belegen dieser Partikel, die mit einer Geste einhergehen 
(bzw. 114 Belegen, in denen diese Geste als abtönend zu interpretieren ist), ist das 
eine beachtliche Zahl. Allerdings ist diese Beobachtung nicht allzu verwundern- 
lich, da auch auf rein verbaler Ebene die Partikel ja gerade diejenige ist, die am 
häufigsten mit anderen Partikeln kombiniert wird (vgl. Thurmair 1989: 208). Dies 
dürfte gerade mit der eher unspezifischen Bedeutung dieser Partikel bzw. mit ih- 
rer weit vorangeschrittenen Grammatikalisierung zu tun haben: Aufgrund der 
Allgemeinheit ihrer Bedeutung lässt die Partikel viel Raum für Interpretation und 
Hinzufügung weiterer Nuancen. Die Daten zeigen, dass diese weitere Spezifizie- 
rung also nicht nur verbal, sondern auch gestisch vorgenommen werden kann. 

Das Gegenteil, nämlich dass die verbale Partikel eine spezifischere abtö- 
nende Bedeutung vermittelt als die Geste, kommt ebenfalls vor. Im Grunde ge- 
nommen ist diese Möglichkeit mit einer allgemeineren Tendenz in der Gestik zu 
verknüpfen, die sich allerdings vor allem in den ikonischen (und z. T. auch in den 
metaphorischen) Gesten zeigt. Tatsächlich sind diese im Allgemeinen als stili- 
sierte Vorstellungen des Referenten zu betrachten, bei denen nur bestimmte re- 
levante oder auffällige Merkmale des Referenten gestisch wiedergegeben werden 
(zum Beispiel in der Darstellungsweise, die Müller (1998: 118) als „die Hand 
zeichnet“ umschreibt, und in der nur der Umriss des Referenten gestisch wieder- 
gegeben wird). Ähnlich ist es auch möglich, dass in der Geste nur bestimmte Fa- 
cetten der Partikelbedeutung ausgedrückt werden. Wenn mit doch zum Beispiel 
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ein Nicken oder ein intersubjektives Deiktikum einhergeht, so wird gestisch nur 
die Einverständnismarkierung vermittelt, nicht jedoch die Adversativitätsnu- 
ance, die in doch typischerweise auch enthalten ist. Ähnlich ist das Vorliegen die- 
ser Gesten bei den Partikeln des Clusters 2b zu deuten: Es wurde bereits mehrfach 
angesprochen, dass die Evidenzmarkierung des Clusters 2b im Grunde genom- 
men die Wahrheits- bzw. Einverständnismarkierung des Clusters 2a impliziert. 
Wenn also eine Partikel des Clusters 2b mit einem Nicken oder einem intersub- 
jektiven Deiktikum kookkurriert, so könnte man auch in diesem Fall sagen, dass 
nur ein Teil der Partikelbedeutung gestisch vermittelt wird. Im Grunde genom- 
men sind auch die illokutionstypbezogenen Gesten hier anzusprechen, denn 
auch sie vermitteln nur einen Teil der Partikelbedeutung - allerdings die illoku- 
tionstypbezogene und nicht die abtönende Facette. 

Daneben ist jedoch - besonders in den Fällen, in denen die Geste selber auch 
als abtönend zu interpretieren ist - noch eine andere Interpretation möglich. Im 
Grunde genommen ließe sich nämlich behaupten, dass die Geste auch in diesen 
Fällen die verbale Äußerung ‚bereichert‘. Tatsächlich vermittelt die Geste eine 
Bedeutung, die zwar durch die Partikelbedeutung impliziert ist, jedoch auf ver- 
baler Ebene nicht explizit markiert wird. In dieser Hinsicht erscheint die Frage 
gerechtfertigt, ob die Geste wirklich als eine stilisierte Realisierung der verbalen 
Partikel zu sehen ist und nicht vielmehr als der gestische Ausdruck einer Partikel, 
die auf verbaler Ebene nicht realisiert wird (zum Beispiel ja im Falle des Nickens). 
Diese Frage übersteigt jedoch den Skopus der vorliegenden Arbeit. 


11.1.3 Gestenkombinationen 


Zum Schluss ist noch auf die Möglichkeit einzugehen, abtönende Bedeutungen 
zu kombinieren, indem Gesten gemeinsam eingesetzt werden. Insgesamt sind im 
Korpus 37 solche Kombinationstypen vorhanden. Auffällig ist, dass 23 dieser 37 
Kombinationen eigentlich als die Kombination einer (oder mehrerer) abtönenden 
Geste(n) mit einer illokutionstypbezogenen Geste zu sehen sind. Es handelt sich 
zum Beispiel um die oben bereits angesprochenen Kombinationen einer illokuti- 
onstypbezogenen Geste mit einem intersubjektiven Deiktikum oder einer PL, 
aber auch Gesten wie das Kopfschütteln und das Achselzucken können mit einer 
illokutionstypbezogenen Geste einhergehen. 

Die Dominanz der Kombinationen, die eine illokutionstypbezogene Kompo- 
nente enthalten (23 von 37 Kombinationstypen bzw. 235 von 306 Kombinations- 
belegen), ist an sich nicht uninteressant, da diese Kombinationen zwei der Facet- 
ten der Bedeutung von Modalpartikeln in sich vereinen: die abtönende und die 
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illokutionstypbezogene. Gerade in dieser Tatsache dürfte auch die Erklärung für 
die hohe Frequenz dieser Kombinationen liegen: Zum einen ist eine Abtönungs- 
bedeutung nicht mit der Markierung des passenden Illokutionstyps unverträg- 
lich (während Abtönungsbedeutungen untereinander durchaus inkompatibel 
sein können), zum anderen dürfte hier auch auf den engen Zusammenhang von 
Abtönung und Illokutionstyp hinzuweisen sein, der gerade die illokutionstypbe- 
zogene Wirkung von Modalpartikeln erklärt. 

Was das Kombinationsverhalten abtönender Gesten untereinander betrifft, 
fällt zunächst auf, dass vor allem Gesten miteinander kombiniert werden, die im 
Hinblick auf das im Abschnitt 9.5 beschriebene Kinaesthem die gleiche Stellung 
einnehmen (positive Stellungnahme: intersubjektives Deiktikum + Nicken; nega- 
tive Stellungnahme: Achselzucken + PL (7), Achselzucken + ZP, Kopfschütteln + 
Achselzucken, Kopfschütteln + ZP usw.). Ausnahmen sind, abgesehen von der 
zweimal belegten Kombination Nicken + Achselzucken (8), nur diejenigen Kom- 
binationen, in denen ein Beat mit einer Geste der negativen Stellungnahme kom- 
biniert wird. Zu beachten ist allerdings, dass auch diese Kombinationen nicht in- 
härent problematisch sind, und zwar aufgrund des bereits angesprochenen 
unterschiedlichen Bezugsbereichs der Gestenkomponenten: Die positive Stel- 
lungnahme bezieht sich auf die aktuelle Äußerung, die negative dagegen auf po- 
tenzielle Einwände gegen diese Äußerung. 

Beispiel (7) zeigt der Abgeordnete Josef Cap, der die Regierungsmitglieder 
fragt, warum ein bestimmter Vertrag nicht im Hinblick auf eine transparentere 
Beschlussfasung im Voraus dem Parlament vorgelegt wurde. Für ihn liegt auf der 
Hand, dass diese Frage beantwortet wird, und dies markiert er durch die Kombi- 
nation eines Achselzuckens (‚ich sehe nicht ein, warum es keine Antwort geben 
sollte‘) und einer PL-Geste (‚ich kann auch nichts dafür, dass eine Antwort hier 
angebracht ist‘). In Beispiel (8) dagegen legt Hera Lind dar, warum sie so gerne 
in Österreich lebt. Einer der Gründe ist, dass sie die österreichischen Männer 
charmant findet, und diese Aussage markiert sie zugleich als wahr (durch das 
Nicken) und als nicht zur Diskussion stehend (durch das Achselzucken). 


(7) PR_Cap3010 
031 JC warUm nicht eigentlich den ANderen 


klubobmännern; 

032 warUm eigentlich nicht den ANderen 
abgeordneten dieses hauses; 

033 warUm hat man nicht diesen vertrag schon 
längst hier °h dem parlament (.) übergebEn 


damit er hier DURCHgearbeitet werden kann; 
034 > {die frAge müssen sie beANTworten;} 
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(8) FG_B1b 

1242 HL > {also äh die Österreichischen männer sind 
einfach (.) unglaublich} (.) charMANT, 

1243 und hElfen einem noch (--) in den MANtel, 

1244 oder (.) auch RAUS- 

1245 oder hAlten einem noch die TÜR auf, 

1246 IN Ft ) noch frau proFEssor [oder so, 

1247 HL [und 

1248 [und (.) die 
KOchen auch noch für ElInen, 

1249 und (.) die sAgen auch noch frau DOKtor, 

1250 auch wEnn man selber gar kein doktor IST 
oder so, 

1251 also die h (.) das HAT was; 

1252 das ist sEhr (.) charMANT, 


jul Di: 


Abb. 40: Nicken + Achselzucken 


Zu erwähnen ist im Rahmen dieser Besprechung der Gestenkombinatorik 
auch die Beobachtung, dass sich mehrere Gesten der negativen Stellungnahme 
(Kopfschütteln, Achselzucken, PL) mit dem Shrug verbinden lassen bzw. als 
Komponenten desselben betrachtet werden können. Gelegentlich wird der Be- 
griff ‚Shrug‘ zur Bezeichnung des Achselzuckens verwendet, aber im Anschluss 
an u. a. Streeck (2007, 2009) soll in vorliegender Arbeit unter diesem Begriff eine 
Kombination unterschiedlicher Bewegungen verstanden werden, die auch ein- 
zeln als Gesten vorkommen können. Streeck (2009: 189) umschreibt den Shrug 
folgendermaßen (ähnlich auch Streeck 2007: 163): 
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A prototypical shrug involves several body-parts, the eye-brows (which are being raised), 
the hands (which are turned so that the palms face up), the forearms (which may be lifted), 
and the shoulders (which are also raised). In addition, the head may be tilted. Thus, shrugs 
are compound enactments. (Hervorhebung im Original) 


Im Anschluss an Morris (1994: 165) fügt Debras (2017) dieser Liste von Bewegun- 
gen noch den sogenannten Mundshrug (‚Mouth Shrug‘) hinzu (vgl. Abb. 67). Es 
handelt sich um die Bewegung, bei der nach Morris die Mundecken kurz mög- 
lichst weit nach unten gezogen werden; Debras selber spricht eher von einer Auf- 
wärts- bzw. Vorwärtsbewegung des Kinns bzw. der Oberlippe. 


Abb. 41: Mundshrug nach Morris (1994: 165) 


Aufgrund dieser Beobachtung ist es nicht verwunderlich, dass diese Gesten 
gelegentlich kombiniert werden. Im Korpus sind insgesamt zehn Belege von Ges- 
tenkombinationen vorhanden, die als ‚Shrug‘ bezeichnet werden können, aber 
auch Kombinationen einzelner Shrugkomponenten sind belegt (vgl. oben). Beim 
Kopfschütteln ist zum Beispiel bei circa einem Viertel der Belege auch mindes- 
tens eine der anderen Shrugkomponenten nachweisbar. Lediglich Kombinatio- 
nen mit dem Mundshrug kommen nicht vor, was darauf zurückzuführen sein 
dürfte, dass dieser ein kurzes Anhalten des Sprechens voraussetzt, während bei 
den anderen ‚Shrug-Gesten‘ im Korpus meist einfach weitergeredet wird. 

Zu beachten ist schließlich noch, dass die Kopfbewegung, von der hier aus- 
gegangen wird, ein Kopfschütteln ist, während in Streecks oben zitierter Be- 
schreibung von einem ‚Tilt‘ (bzw. einer seitlichen Verkantung) des Kopfes die 
Rede ist. Tatsächlich kommt ein solcher Tilt bei den Shrugs im Korpus nicht vor, 
und auch allgemein ist der Tilt im Korpus eher selten; stattdessen wird bei den 
Shrugs der Kopf geschüttelt. Hier könnte eine Ungenauigkeit in Streecks Be- 
schreibung oder ein Unterschied zwischen dem ‚deutschen‘ und dem ‚engli- 
schen‘ Shrug zutage treten. Allerdings ist es auch möglich, dass die Bedeutung 
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hier eine Rolle spielt.’ An sich ist der Shrug das Emblem des Nichtwissens, aber 
in der ‚abtönenden‘ Verwendung liegt eine spezifische Nuance vor, nämlich ‚ich 
weiß nicht, wie es anders sein könnte‘ oder ‚ich weiß nicht, wie ich es anders 
sagen sollte‘ (d. h. die Nuancen, die oben für das abtönende Kopfschütteln und 
Achselzucken erwähnt wurden, was das Vorkommen des Kopfschüttelns als 
Shrugkomponente erklären dürfte). Dies zeigt sich auch in Beispiel (9): Schau- 
spielerin Thekla Carola Wied erläutert, dass sie im Laufe ihrer Karriere bestimmte 
Rollen abgelehnt hat, um nicht „das Image“ zu bedienen, aber trotzdem konnte 
sie nicht umhin, dieses Image zu bedienen: Das ist halt so, man kann es nicht 
ändern. Gerade diese Tatsache, dass sie nicht mehr dazu sagen kann bzw. will, 
dürfte die Verwendung des Kopfschüttelns in diesem Fall erklären. 


(9) FG_B2a* 

1227 TW wie Oft hab ich mich auch verWElIgert, 

1228 und hAb gesagt NEIN- 

1229 ich mAche das jetzt NICHT- 

1230 das bedIEnt ja WIEder das 

1231 ich !WOLL!te kein image bedlIEnen; 

1232 das WOLLte ich in kEInem fall- 

1233 > aber es Ist immer wieder (---) äh { (---) 
WAR=s halt so, 

1234 [dass} 

1235 HR [w wobei gegen intelligEnte äh [komödie nix 
SPRICHT nicht? 

1236 TW [da hab dAs 
hab ich IMmer gesagt, 

1237 HR also 

1238 TW ne g ne m ne mo ne gUte unterHAltung- 

1239 [und ne bo ne tOlle koMödie- 

1240 RB [mhm 

1241 mhm 

1242 TW das sch mAch ich (-) äh ähm LIEbend, 

1243 GERne, 


3 Dass sich Korrelationen zwischen den formalen Varianten des Shrugs und seinen unterschied- 
lichen Bedeutungen nachweisen lassen, hat Debras (2017) bereits gezeigt. Für eine detailliertere 
Übersicht der Funktionen des Shrugs sei ebenfalls auf Debras (2017) verwiesen. 

4 Auffällig ist, dass die Komponenten des Shrugs nicht zeitgleich einsetzen: Die Handgeste 
fängt später an als das Kopfschütteln und das Achselzucken. Auf diese Möglichkeit der zeitli- 
chen ‚Diskrepanz‘ hat auch Streeck (a. a. O.) bereits hingewiesen. 
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Abb. 42: Shrug mit halt 


Um herauszufinden, inwiefern es sich bei der Distribution Kopfschütteln/Tilt tat- 
sächlich um eine Bedeutungsfrage handelt, wäre es auch nützlich, der Frage 
nachzugehen, mit welchen Kopfgesten der Shrug als Emblem des Nichtwissens 
im Deutschen vorkommt. Dies ist allerdings, mangels Belege dieser Verwendung 
im Korpus, an dieser Stelle nicht möglich. 

Da der Shrug an sich eine komplexe Geste bzw. ein Gestenamalgam ist, stellt 
sich zum Schluss noch die Frage, ob man die unterschiedlichen Komponenten 
separat zählen sollte oder ob vielmehr der Shrug als Ganzes als eine Geste zu zäh- 
len ist. Eine ähnliche Frage ließe sich für die im Abschnitt 10.4 besprochenen 
Gesten (Börsenhand und senkrechter Ring) stellen, da diese im Normalfall mit 
einem Beat einhergehen. Wenn dieser Beat ein inhärenter Teil der Geste ist, soll 
er dann noch separat als Beat gezählt werden oder nicht? In vorliegender Arbeit 
wurde davon ausgegangen, dass es sich um Kombinationen von einzelnen Ges- 
ten handelt, die separat zu zählen sind, da es auch Belege gibt, in denen nur ein- 
zelne Komponenten nachzuweisen sind. Wenn man allerdings davon ausgeht, 
dass es sich um verfestigte Einheiten handelt, ließe sich auch die Alternative ver- 
teidigen, die komplexe Geste als Ganzes als eine einzige Geste zu betrachten und 
zu zählen. Eine ausführliche Diskussion der Fragen, wo man die Grenze zwischen 
einfachen Kombinationen und richtigen Komplexen zieht und welche Analyse 
für die hier angesprochenen komplexen Gesten die angemessenere ist, kann al- 
lerdings im Rahmen der vorliegenden Arbeit nicht geliefert werden, sodass dafür 
optiert wurde, diese Phänomene als normale Gestenkombinationen zu betrach- 
ten und dementsprechend die kombinierten Elemente einzeln zu zählen. 


11.2 Wiederholung 


Neben der multimodalen Kombinierbarkeit abtönender Bedeutungen soll auch 
deren multimodale Wiederholbarkeit an dieser Stelle einer näheren Betrachtung 
unterzogen werden. Da in vorliegender Arbeit insbesondere die Kookkurrenz von 
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Partikeln und Gesten zentral steht, sollen allerdings nur diejenigen Wiederholun- 
gen betrachtet werden, in denen die Abtönung wenigstens einmal im Laufe der 
Wiederholungssequenz durch eine Partikel-Geste-Kombination realisiert wird; 
die Sequenzen, in denen die Abtönung jeweils nur auf verbaler oder nur auf ges- 
tischer Ebene realisiert wird, sollen nur zu Vergleichszwecken herangezogen 
werden, werden jedoch nicht ins Detail analysiert.’ 

Insgesamt sind im Korpus 48 Wiederholungssequenzen enthalten, in denen 
die abtönende Bedeutung wenigstens einmal sowohl verbal als auch gestisch ver- 
mittelt wird. Die Hinzufügung ‚wenigstens einmal‘ ist nicht unwichtig, denn es 
ist keineswegs so, dass die Abtönungsbedeutung in einer solchen Sequenz syste- 
matisch auf beiden Ausdrucksebenen (verbal und gestisch) ausgedrückt wird. 
Insgesamt ist dies nur bei 15 der 48 Sequenzen der Fall; in den anderen Fällen 
wird die abtönende Bedeutung auch wenigstens einmal nur verbal oder nur ges- 
tisch zum Ausdruck gebracht. 

Bei den Fällen mit konstanter multimodaler Abtönung fällt auf, dass jeweils 
sowohl die Geste als auch die Partikel gleich bleiben. Es ist also nicht so, dass mit 
gleichbleibender Geste plötzlich eine andere Partikel eingesetzt würde, oder dass 
mit der gleichen Partikel plötzlich eine andere Geste einherginge.‘ Allerdings ist 
zu beachten, dass die Geste vielfach subtiler wird, zum Beispiel indem die 
Amplitude der Bewegung abnimmt oder indem nur bestimmte Facetten eines 
komplexen Gestikmusters wiederholt werden. Eine weitere Möglichkeit ist, dass 
die Geste zunächst beidhändig, in der Wiederholung jedoch nur einhändig reali- 
siert wird. 

Eine solche ‚Abschwächung‘ ist nichts Ungewöhnliches: Auch im Falle einer 
wiederholten Geste ohne Partikel sowie in Sequenzen, in denen nur die Geste, 
nicht jedoch die Partikel wiederholt wird, ist dieses Phänomen wahrzunehmen.’ 
Insgesamt sind im Korpus 21 Sequenzen enthalten, in denen bei einer wiederhol- 
ten Geste nicht jedes Mal eine Partikel eingesetzt wird. In den meisten Fällen wird 
in solchen Sequenzen nur die erste Geste mit einer Partikel kombiniert; in zwei 


5 Eine weiterführende Frage wäre, ob es einen Unterschied ausmacht, ob nur die Abtönung wie- 
derholt wird oder ob es sich um eine nahezu wörtliche Wiederholung der ganzen verbalen Äu- 
Berung handelt. Da die (fast) wörtlichen Wiederholungen im Korpus mit nur vier Belegen eher 
selten sind, kann dieser Frage jedoch nicht weiter nachgegangen werden. Weitere Faktoren, de- 
ren Rolle noch eingehender zu untersuchen wäre, sind die Zahl der Wiederholungen und die 
Distanz zwischen den einzelnen Realisierungen. 

6 Nur eine Ausnahme ist zu verzeichnen, in der die PL das erste Mal mit einfach, das zweite Mal 
mit der objektiveren (aber demselben Cluster angehörigen) Partikel eben kombiniert wird. 

7 Vgl. ähnlich auch u. a. McNeill (1992: 175) zur Abschwächung bei der Wiederholung ikoni- 
scher Gesten. 
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längeren Sequenzen handelt es sich jedoch um zwei von drei (ja + illokutionstyp- 
bezogene Geste) bzw. um drei von elf (doch + senkrechter Ring) Instanzen, in de- 
nen neben der Geste auch die Partikel realisiert wird. Zur Verdeutlichung kann 
auf Beispiel (10) aus Kapitel 9 zurückverwiesen werden, das hier wieder aufge- 
nommen wird. In diesem Fall werden zwei aufeinander folgende Aufforderungen 
durch eine Börsenhand abgetönt, und in der ersteren ist auch die Partikel doch 
enthalten. Die beiden abtönenden Elemente kritisieren die Haltung des Bundes- 
kanzlers, aber nachdem sie einmal zusammen realisiert worden sind, wird nur 
die Geste wiederholt. 


(10) PR_Strac0811 
043 HS und SAgen wir die wAhrheit. 


044 i mein sIE haben s es heute selber an selbst 
ANgesprochen herr bundeskanzler; 

045 frAgen sie doch die Österreicher haben si 
UNS zugeworfen, 

046 der FREIheitlichen fraktiOn; 

047 > {ja FRAgen sie doch die Österreicher herr 
bundeskanzler, } 

048 > {1lAssen sie sie ABstimmen; } 


Abb. 43: Wiederholte Börsenhand (links = Einheit 047; rechts = Einheit 048) 


Auch die umgekehrte Möglichkeit ist im Korpus 12 Mal belegt, nämlich dass 
nur die Modalpartikel, nicht jedoch die Geste wiederholt wird. In diesen Fällen 
handelt es sich nur um einfache Wiederholungen (d. h. einmal Geste+Partikel, 
einmal nur die Partikel), in denen jeweils die erste Partikel von einer Geste be- 
gleitet wird. Auch an dieser Stelle kann ein älteres Beispiel wieder aufgegriffen 
werden, nämlich Beispiel (1) aus Kapitel 8, das hier als Beispiel (11) nochmals 


8 In einem Ausnahmefall aus den Parlamentsreden (PR_Cap3010) ist es nur die zweite Partikel, 
die mit einer Geste kombiniert wird (ja + intersubjektives Deiktikum). Allerdings ist der Redner 
beim Äußern der ersten Partikel mit dem Zurechtlegen seiner Notizen beschäftigt, was das Rea- 
lisieren der Geste bei der ersten Partikelinstanz verhindert haben dürfte (vgl. Abschnitt 12.3.3). 
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aufgenommen wird. Dieser Auszug enthält zwei aufeinander folgende Intona- 
tions- bzw. Äußerungseinheiten mit der Partikel ja, aber nur die erste wird von 
einem intersubjektiven Deiktikum begleitet. 


(11) FG_Bla 

425 IN hey äh hat man da überhaupt g gelEgenheit 
bei solchen shows mit den stars dann hinter 
der BÜHne mal,= 

426 > =s Ist ja {nicht mehr so wie FRüher; } 

427 ihr HABT ja früher, 

428 HÖRT man immer wIEder; 

429 recht LANG gefElert; 


Auffällig ist die Beobachtung, dass bis auf den in Fußnote 8 angesprochenen 
Ausnahmefall die Geste immer mit dem ersten Partikelbeleg einhergeht’, da sie 
mit der zuvor gemachten Beobachtung übereinstimmt, dass bei wiederholter 
Geste die Partikel jeweils bei der ersten Instanziierung der Geste eingesetzt wird. 
Im Normalfall scheint also die stärkste Abtönung am Anfang der Wiederholungs- 
sequenz vorzuliegen. Damit im Einklang ist auch die Beobachtung, dass die Geste 
(wenn sie wiederholt wird) im Laufe der Sequenz oft subtiler wird. Zudem sei da- 
ran erinnert, dass eine Wiederholung von Partikel und Geste nur in 15 der 48 Wie- 
derholungssequenzen vorliegt; in den meisten Fällen wird also nur entweder die 
Partikel oder die Geste wiederholt. Es scheint mit anderen Worten so zu sein, dass 
nach einer deutlichen multimodalen Angabe der Abtönung eine abgeschwächte 
Variante (subtilere Geste bzw. nur die Partikel oder nur die Geste) ausreicht, um 
die ganze Abtönung wieder hervorzurufen. Wenn allerdings keine Abschwä- 
chung vorliegt und sowohl die Partikel als auch die Geste wiederholt werden, so 
bleibt im Normalfall die Partikel-Geste-Paarung konstant, und die Partikel oder 
die Geste wird nicht auf einmal gegen eine andere ausgetauscht. 


11.3 Fazit 


Obwohl aufgrund der niedrigen Belegzahlen sowie der Beschränkungen, die mit 
dem Rahmen der vorliegenden Arbeit einhergehen, keine detaillierte Analyse des 
Einflusses der Kombinatorik und Rekurrenz von Abtönungsbedeutungen auf die 


9 Inden 25 weiteren Sequenzen von Partikelwiederholung im Korpus, in denen die erste Instan- 
ziierung der Partikel nicht mit einer Geste kookkurriert, werden also auch mit den weiteren Par- 
tikeln keine Gesten eingesetzt. 
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Gestik vorgenommen werden konnte, hat die vorangehende Diskussion einige in- 
teressante Beobachtungen erlaubt, die einen wertvollen Ansatz für weitere Un- 
tersuchungen in dieser Richtung bilden. 

Festzuhalten bleibt, dass Gesten, die mit Partikelkombinationen einherge- 
hen, von der Bedeutung her mit den beiden Partikeln kompatibel sein müssen 
und, wenn sie selber als abtönend zu betrachten sind, eher mit der Partikel mit 
der stärkeren bzw. spezifischeren Abtönungsbedeutung zu verknüpfen sein dürf- 
ten. Was die Wiederholung von abtönenden Bedeutungen betrifft, fällt auf, dass 
von einer Partikel-Geste-Kombination meist nur entweder die Partikel oder die 
Geste wiederholt wird. Wenn die Kombination einmal etabliert ist, scheint es also 
auszureichen, dass eines der Elemente der Kombination wiederholt wird, um die 
ganze Kombination wieder aufzurufen. Falls jedoch immerhin beide wiederholt 
werden, so bleibt diese Kombination im Normalfall konstant: Die gleiche Partikel 
wird in einer Wiederholungssequenz nicht plötzlich mit einer anderen Geste 
kombiniert oder umgekehrt. 

Obwohl aufgrund der beschränkten Datensammlung eine gewisse Vorsicht 
geboten ist, suggerieren diese Ergebnisse, dass bei Partikelkombinationen vor al- 
lem die Partikel mit der spezifischeren Bedeutung eine Rolle spielt, und dass es 
bei einer Wiederholung ausreicht, dass die Partikel-Geste-Kopplung einmal deut- 
lich gemacht wird, um sie weiterhin gelten zu lassen, auch wenn nicht jedes Mal 
beide Modi wiederholt werden. Es dürfte sich hier also um generelle Prinzipien 
handeln, die zwar aus der Übersetzungsforschung hervorgegangen sind, aller- 
dings für die Sprache im Allgemeinen gelten und sich auch in deren Multimoda- 
lität zeigen. Um diesen Fragen auf den Grund zu gehen, bleibt jedoch (wie ange- 
sprochen) weitere Erforschung erforderlich. 


12 Distribution der abtönenden Gesten 


12.0 Einführung 


In den vorangehenden Kapiteln wurde mehrfach suggeriert, dass externe Fakto- 
ren die Realisierung abtönender Gesten unterdrücken können oder die Distribu- 
tion der Gesten auf eine andere Weise beeinflussen können. Dies soll in diesem 
Kapitel näher untersucht werden. Bevor auf diese einzelnen Faktoren und deren 
Einfluss auf die besprochenen Kookkurrenzmuster eingegangen wird, erscheint 
es jedoch sinnvoll, die einzelnen Ergebnisse aus den vorangehenden Kapiteln zu- 
sammenzuführen und ein Gesamtbild der Distribution der Gesten zu bieten. Da- 
her soll zunächst auf die Distribution der Gesten über die einzelnen Partikeln 
(12.1) und über die Datentypen (12.2) eingegangen werden, bevor eine Übersicht 
von (möglicherweise) die Distribution der Gesten beeinflussenden Faktoren so- 
wie eine Finschätzung ihrer Erklärungsstärke geliefert wird (12.3). 


12.1 Distribution über die Partikeln 


Als erster Schritt dieser übergreifenden Distributionsanalyse scheint es wertvoll, 
die allgemeine Distribution der Gesten über die einzelnen Partikeln einer nähe- 
ren Betrachtung zu unterziehen. Dazu wird zunächst (12.1.1) der Frage nachge- 
gangen, wie sich die Partikeln zu den drei Gestikdimensionen abtönend, abtö- 
nungsunterstützend und illokutionstypbezogen verhalten, und in einem zweiten 
Schritt (12.1.2) wird auf die Homogenität der Gesteninventare der einzelnen Par- 
tikeln eingegangen. 


12.1.1 Partikeln und Gestikdimensionen 


In der Tabelle 8 wird für jede der Partikeln angegeben, wie viele der Belege, bei 
denen der Sprecher sichtbar ist, mit einer abtönenden, einer abtönungsunterstüt- 
zenden oder einer illokutionstypbezogenen Geste einhergehen, oder aber mit ei- 
ner Gestenkombination, in der sowohl die abtönende als auch eine andere (in 
den meisten Fällen die illokutionstypbezogene) Dimension nachzuweisen ist (die 
Spalte ‚mehrere Dimensionen‘). 
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Tab. 8: Partikeln und die abtönungsliierten Gestikdimensionen 
(Die eingeklammerte Zahl ist jeweils die Zahl der ‚sichtbaren‘ Partikelbelege.) 


v à 
e > = 
ı © + v 
58 A 5 
z es oo sS o-= 
o >% 5 0 5.2 v 
= ES 5% 25 E 
:0 © O x oO = 
3 5: ó g a E 5 
© o 5 r- EA A 
denn (63) 1 (0) 3 3 7 
1,59% 0,00% 4,76% 4,76% 11,11% 
eigentlich (24) 2 1 1 3 7 
8,33% 4,17% 4,17% 12,50% 29,17% 
ja (475) 69 7 57 45 178 
14,53% 1,47% 12,00% 9,47% 37,47% 
doch (84) 18 0 9 5 32 
21,43% 0,00% 10,71% 5,95% 38,10% 
eben (62) 20 2 4 2 28 
32,26% 3,23% 6,45% 3,23% 45,16% 
einfach (135) 53 0 5 6 64 
39,26% 0,00% 3,70% 4,44% 47,41% 
halt (65) 13 0 4 7 24 
20,00% 0,00% 6,15% 10,77% 36,92% 


Wichtig ist, an dieser Stelle nochmals darauf hinzuweisen, dass in der vorlie- 
genden Arbeit auf nonverbaler Ebene nur die Gestik in Betracht gezogen wird. 
Die Abwesenheit abtönunsgsliierter Gestik impliziert also nicht unbedingt, dass 
nicht auf anderen Ebenen (Körperhaltung u. dgl.) durchaus nonverbal abgetönt 
wird. Insofern liefert die Tabelle ein unvollständiges Bild. Außerdem wird das 
Bild einigermaßen verzerrt durch die Tatsache, dass nicht alle Partikeln gleich 
häufig belegt sind. 

Trotzdem deuten die Angaben in der Tabelle auf einige Tendenzen. Am auf- 
fälligsten ist wohl, dass der Anteil der Belege, die durch eine Geste begleitet wer- 
den, pro Cluster von oben nach unten zunimmt. Noch deutlicher zeigt sich diese 
Tendenz, wenn man sich auf die abtönenden Gesten beschränkt: Die Partikeln im 
Cluster 1 kookkurrieren im Durchschnitt in 13,29% der Fälle mit einer abtönenden 
Geste (oder einer ‚mehrdimensionalen‘ Geste, in der die abtönende Funktion ent- 
halten ist), bei Cluster 2a handelt es sich um 25,69% und bei Cluster 2b sind es 
36,65%. 

An sich war die niedrige Frequenz der abtönenden Gesten bei den Partikeln 
des Clusters 1 aufgrund der Analyse in den vorangehenden Kapiteln zu erwarten. 
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Tatsächlich sind vor allem Gestikmuster beschrieben worden, die sich an erster 
Stelle mit den Clustern 2a/b in Verbindung bringen lassen. Zum Teil dürfte das 
damit zu tun haben, dass bei der Abgrenzung des Clusters 1 eher die konnektie- 
rende als die eigentlich abtönende bzw. (inter)subjektive Wirkung der Partikeln 
eine Rolle spielte: Die Partikeln denn und eigentlich binden eine Frage in den Ge- 
sprächszusammenhang ein und geben an, wie sich die Frage zum Kontext verhält 
(denn: die Frage folgt aus Vorgegebenem; eigentlich: thematischer Übergang). 
Eine intersubjektive Facette ist zwar insofern nachweisbar, als durch das Einset- 
zen der Partikel einer Unverständnisreaktion des Hörers im Hinblick auf die Re- 
levanz der Frage an der Stelle im Gespräch entgegengewirkt wird, aber eine der- 
maßen klare Abtönungsnuance wie im Falle der Cluster 2a/b liegt nicht vor 
(obwohl denn vielfach mit einer Erstaunensnuance zu verknüpfen ist). Dazu 
passt auch die Beobachtung, dass denn eine Entwicklung zum reinen Fragean- 
zeiger durchzumachen scheint. Dementsprechend ist es nicht verwunderlich, 
dass bei diesen Partikeln weniger abtönende Gesten nachzuweisen sind.' 

Die Partikeln des Clusters 2a werden ebenfalls weniger häufig durch Gesten 
begleitet als jene des Clusters 2b. Auffällig ist aber, dass die abtönenden Gesten 
bei Cluster 2b deutlich stärker vertreten sind, während für die illokutionstypbe- 
zogenen Gesten das Gegenteil gilt: Bei Cluster 2a sind im Durchschnitt 25,69% 
der Gesten abtönend und 19,07% illokutionstypbezogen, gegenüber 36,65% ab- 
tönend und 11,58% illokutionstypbezogen bei Cluster 2b (erneut wurden die Ele- 
mente der Spalte ‚mehrere Dimensionen‘ mitgezählt, sofern in ihnen die abtö- 
nende bzw. die illokutionstypbezogene Dimension nachweisbar ist).? 

Auch in diesem Fall dürfte die Distribution auf die Bedeutung der Cluster zu- 
rückzuführen sein. Im Laufe der Arbeit ist bereits mehrfach darauf hingewiesen 
worden, dass die abtönende Nuance, die zur Definition des Clusters 2a herange- 
zogen wurde, als ‚schwächer‘ betrachtet werden könnte als jene des Clusters 2b: 
Mit den Partikeln des Clusters 2a wird markiert, dass ein Sachverhalt wahr oder 
bekannt ist oder dass Einverständnis darüber besteht, während dieser Sachver- 
halt durch die Partikeln des Clusters 2b als evident, einzigmöglich oder aus- 
nahmslos gültig eingestuft wird. Das Zutreffen des Sachverhalts wird also durch 
die Partikeln des Clusters 2b stärker hervorgehoben als durch die Partikeln des 
Clusters 2a.’ Zudem sei an die bereits angesprochene Hypothese erinnert, dass ja, 


1 Die niedrigere Frequenz der illokutionstypbezogenen Gesten im Vergleich etwa zum Cluster 
2a ließe sich allerdings nicht so erklären und bedarf weiterer Erforschung. 

2 Diese Distribution ist signifikant: X?=20,19; p<0,001. 

3 Dazu passt auch die Beobachtung, dass die Partikel doch, die im Vergleich zu ja zusätzlich 
eine Adversativitätsnuance zum Ausdruck bringt (und dementsprechend ebenfalls als von der 


Distribution über die Partikeln — 215 


ähnlich wie denn, einer starken Tendenz zur Grammatikalisierung unterliegt, die 
es zu einer Art Illokutionstypmarkierer werden lässt, denn dies dürfte ebenfalls 
zum Teil die Distribution der abtönenden und der illokutionstypbezogenen Ges- 
ten bei dieser Partikel erklären. 

Auffällig ist auch, dass einfach - trotz seines stärkeren Hanges zur Kontext- 
verschiebung als andere Partikeln - nicht wesentlich häufiger mit illokutionstyp- 
bezogenen Gesten kombiniert wird, obwohl aufgrund der Ergebnisse der Fallstu- 
dien die Vermutung naheliegt, dass gerade diese Gesten die typischen Gesten für 
kontextverschobene Partikeln sind. Möglicherweise etwas überraschend ist gar 
die Feststellung, dass einfach im Vergleich zu den anderen Partikeln am wenigs- 
ten mit illokutionstypbezogenen Gesten, dafür am häufigsten mit abtönenden 
Gesten kookkurriert. Allerdings ist diese Tendenz nicht signifikant (X?=2,44; 
p>0,05). Diese Zahlen können also nicht zur weiteren Bestimmung des genauen 
Verhältnisses zwischen den Partikeln des Clusters 2b herangezogen werden. 


12.1.2 Uniformität 


Wenn die Verteilung der Gesten über die drei Dimensionen keinen richtigen Auf- 
schluss über das Verhältnis der Partikeln eben, einfach und halt bringt, erscheint 
es als ein plausibler nächster Schritt, die konkreten Gesteninventare der drei Par- 
tikeln zu vergleichen und zu schauen, ob diese Inventare auf bestimmte Tenden- 
zen und Unterschiede (bzw. Übereinstimmungen) schließen lassen. Da aller- 
dings ein solcher Vergleich auch für die Beziehungen zwischen den Partikel- 
clustern relevant sein kann, soll erneut mit dieser allgemeineren Perspektive an- 
gefangen werden. Insbesondere soll an dieser Stelle der Frage nachgegangen 
werden, wie homogen die Gesteninventare pro Partikel sind und wie stark sich 
die Gesteninventare der unterschiedlichen Partikeln ähneln. Als Hilfsmittel wer- 
den dazu die sogenannten internen und externen Uniformitätswerte von Geera- 
erts/Grondelaers/Speelman (1999) herangezogen. 

Der interne Uniformitätswert (oder I-Wert) ist ein Maß für die Homogenität 
einer Datensammlung. Je höher dieser I-Wert ist (mit Maximalwert 1), umso ho- 
mogener ist die Datensammlung. Dabei wird sowohl die Anzahl der belegten 
Werte (in diesem Fall also die unterschiedlichen Gesten) als auch deren relative 
Frequenz berücksichtigt: Je mehr Gesten im Spiel sind — und insbesondere: je 
mehr Gesten relativ gesehen eine stärkere Position einnehmen -, umso niedriger 


Bedeutung her ‚stärker‘ betrachtet werden könnte), relativ häufiger als ja mit einer abtönenden 
Geste kombiniert wird. 
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ist der /-Wert. Eine höhere interne Uniformität wäre dementsprechend ein Indiz 
für eine stärkere Beziehung der Partikel mit einer bestimmten Geste (oder mit ei- 
ner beschränkten Gruppe von Gesten). Indirekt kann der I-Wert dadurch auch als 
ein Indiz für die Stärke bzw. die Abgrenzbarkeit der Partikelbedeutung gesehen 
werden: Wenn eine Partikel eine starke Korrelation mit wenigen Gesten aufweist 
(hoher I-Wert), so ist ihre Bedeutung klarer zu umreißen und steht in engerer Be- 
ziehung zur Bedeutung dieser Gesten, während eine schwächere Korrelation mit 
mehreren Gesten (niedriger I-Wert) eher auf eine vagere und nicht so klar abzu- 
grenzende Bedeutung hinweist.“ 

Der externe Uniformitätswert (oder U-Wert) gibt dagegen an, wie stark sich 
Datensammlungen ähneln. Auch hier gilt: Je höher der U-Wert ist (mit Maximal- 
wert 1), umso ähnlicher sind die Datensammlungen. Der U-Wert zeigt also, wie 
groß die Übereinstimmungen zwischen den Gesteninventaren zweier Partikeln 
sind. Erneut wird dabei sowohl die Zahl der gemeinsamen (und nicht-gemeinsa- 
men) Gesten als auch deren relative Frequenz berücksichtigt. Wenn man die Ges- 
teninventare als Indiz für die Partikelbedeutungen verwendet, so ist also ein hö- 
herer U-Wert (größere Ähnlichkeit zwischen den Gesteninventaren) als eine 
größere Bedeutungsähnlichkeit zwischen den betroffenen Partikeln, ein niedri- 
gerer U-Wert dagegen als ein größerer Bedeutungsunterschied zu interpretieren. 

Tabelle 9 liefert eine Übersicht der I-Werte der sieben Partikeln, die den Aus- 
gangspunkt für die vorliegende Arbeit bilden, sowie der U-Werte für jeden der 
drei Partikelcluster. Auffällig ist, dass sowohl die I-Werte als auch die U-Wertein 
der Spalte ‚alle Belege‘ deutlich höher sind als in den anderen Spalten. Dies ist 
darauf zurückzuführen, dass jede einzelne Partikel in mehr als der Hälfte der Be- 
lege (Zahlen variieren zwischen 52,59% für einfach und 88,89% für denn, vgl. Ab- 
schnitt 12.1.1) nicht mit einer abtönungsliierten Geste einhergeht. Daher liefern 
die Angaben in dieser Spalte ein etwas verzerrtes Bild, denn die hohe Anzahl der 
Belege ohne abtönunsgsliierte Geste erhöht die Uniformitätswerte, ohne Aussa- 
gen über die Partikelbedeutungen zu erlauben. Höchstens sind sie ein Indiz für 
den Grammatikalisierungsgrad (und den damit einhergehenden Grad der Bedeu- 
tungsverblassung), aber über die Genauigkeit und Ähnlichkeit der Partikelbe- 
deutungen sagen diese Belege nichts aus. Daher sollen diese Angaben in der fol- 
senden Besprechung nicht weiter berücksichtigt werden. Beschränkt man sich 
auf die Partikelbelege, bei denen eine abtönunsgsliierte Geste vorliegt (Spalte ‚alle 
Gesten‘), so sind die Uniformitätswerte wesentlich niedriger. Interessant sind 


4 Vgl. Schoonjans/Feyaerts (2010) für eine ähnliche Anwendung des /-Wertes in einer Überset- 
zungsanalyse von denn und eigentlich. 
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diese Angaben aber vor allem im Vergleich zur letzten Spalte, in der nur die Par- 
tikelbelege mit einer abtönenden Geste berücksichtigt worden sind.’ 


Tab. 9: Allgemeine Übersicht der Uniformitätswerte 


alle Belege alle Gesten abtönende Gesten 

l U l U l U 
denn 10,77 10,31 10,25 

i 0,78 ! 0,39 ! 0,40 
eigentlich 10,51 10,14 10,20 
ja 10,41 [0,15 10,10 

| 0,85 | 0,59 | 0,44 
doch 10,42 10,18 0,19 
eben 10,34 10,17 10,24 
einfach 10,33 0,62 10,19 0,21 10,22 0,16 
halt 10,41 10,10 10,11 


Was die I-Werte betrifft, sind zwei Beobachtungen zu machen. Die erste ist, 
dass die Werte in der Spalte ‚abtönende Gesten‘ für die meisten Partikeln etwas 
höher liegen als in der Spalte ‚alle Gesten‘. Ausnahmen stellen jedoch die Parti- 
keln ja und denn dar. Dies ist insbesondere mit der relativen Wichtigkeit der il- 
lokutionstypbezogenen Gesten zu verknüpfen: Nur bei diesen beiden Partikeln 
sind die illokutionstypbezogenen Gesten ungefähr gleich zahlreich (ja) oder gar 
zahlreicher (denn) als die abtönenden (vgl. Abschnitt 12.1.1). Wie im vorigen Ab- 
schnitt bereits suggeriert wurde, dürfte das ebenfalls auf eine weniger starke ab- 
tönende Wirkung (im wahrsten Sinne des Wortes) bzw. auf eine weiter vorange- 
schrittene Grammatikalisierung dieser Partikeln zurückzuführen sein. 

Ein ähnliches Bild zeigt sich auch beim Vergleich der einzelnen I-Werte in 
der Spalte ‚abtönende Gesten‘, die im Hinblick auf die rein abtönende Wirkung 
der Partikeln die interessanteste ist. Tatsächlich ist der I-Wert der Partikel ja nied- 
riger als jener der Partikel doch sowie der Partikeln des Clusters 2b. Dies dürfte 
tatsächlich ein zusätzliches Indiz für die allgemeinere bzw. schwächere Bedeu- 
tung der Partikel ja gegenüber diesen anderen Partikeln sein - wie im Laufe der 
Arbeit schon mehrfach suggeriert worden ist: Wenn die Bedeutung an sich weni- 
ger spezifisch ist, so erlaubt sie auch mehr kontextinduzierte Variation, mit der 


5 Erneut handelt es sich sowohl um die rein abtönenden Gesten als auch um die Gesten, in de- 
nen neben der abtönenden auch die abtönungsunterstützende oder die illokutionstypbezogene 
Dimension deutlich nachzuweisen ist. 
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eine gestische Spezifizierung der Bedeutung einhergehen kann. Tatsächlich sind 
nahezu alle in den vorangehenden Kapiteln besprochenen Gesten mit ja belegt — 
auch diejenigen, die an erster Stelle mit doch oder den Partikeln des Clusters 2b 
verknüpft wurden (Kopfschütteln, Achselzucken, PL, ZP usw.). 

Dies führt nahtlos zur zweiten Beobachtung bezüglich der I-Werte. Bei einem 
Vergleich der I-Werte der Partikeln des Clusters 2b stellt sich heraus, dass das 
Gesteninventar der Partikel halt wesentlich weniger homogen ist als jenes der 
Partikeln eben und einfach. Dies zeigt sich schon in der Spalte ‚alle Gesten‘, noch 
deutlicher aber in der Spalte ‚abtönende Gesten‘. Halt weist mit anderen Worten 
keine so starke Beziehung zu einer bestimmten Geste auf wie etwa einfach zum 
Kopfschütteln und kookkurriert zudem mit mehr unterschiedlichen Gesten als 
jede der beiden anderen Partikeln - darunter sowohl Gesten, die stärker mit ein- 
fach zusammenhängen (wie das Kopfschütteln), als auch solche, die stärker mit 
eben zusammenhängen (wie das Nicken). 

Auffällig ist in dieser Hinsicht auch, dass der U-Wert des Clusters 2b wesent- 
lich niedriger ist als jener des Clusters 2a. Zum Teil dürfte das damit zu tun haben, 
dass im letzteren Fall eine Partikel mehr im Spiel ist (vgl. aber Tabelle 10, in der 
die U-Werte pro Partikelpaar geliefert werden), aber es scheint doch eine größere 
Bedeutungsähnlichkeit zwischen den Partikeln ja und doch anzusetzen zu sein, 
als bei den Partikeln eben, einfach und halt der Fall ist. Dies stimmt mit derin den 
Abschnitten 2.3.2-3 gemachten Beobachtung überein, dass sich die Bedeutung 
von doch von der Bedeutung der Partikel ja insbesondere darin unterscheidet, 
dass erstere zusätzlich eine Adversativitätsnuance umfasst. Die Einverständnis- 
nuance von ja ist aber vorhanden. Eben, einfach und halt dagegen können zwar 
verallgemeinernd als Evidenzmarkierer eingestuft werden, aber eine Nuance, die 
den drei Partikeln gemeinsam ist (ähnlich wie die Einverständnisnuance von ja), 
ist nicht so deutlich nachzuweisen. 

Um zu einem besseren Verständnis des genauen Verhältnisses der Partikeln 
des Clusters 2b zu kommen, scheint es wertvoll, neben der übergreifenden Be- 
trachtung aus Tabelle 9 die Partikeln auch einmal paarweise unter die Lupe zu 
nehmen. Die U-Werte für die drei möglichen Partikelpaare werden in Tabelle 10 
geliefert. Was sofort auffällt, ist, dass einfach und halt näher zueinander zu ste- 
hen scheinen als zu eben: Die U-Werte für das Partikelpaar einfach-halt sind auf 
der ganzen Linie höher als jene der anderen Paare. Besonders im Hinblick auf die 
abtönenden Gesten zeigt sich dies eindeutig, denn in diesem Fall ist der U-Wert 
für einfach-halt mit 0,55 etwa doppelt so hoch wie die Werte der anderen Parti- 
kelpaare (0,27 und 0,28). Aufgrund dieser Ergebnisse ist die in Kapitel 7 formu- 
lierte Annahme eines Kontinuums einfach - halt - eben schwer aufrechtzuerhal- 
ten (sonst wäre zu erwarten, dass eben eine deutlich größere Ähnlichkeit zu halt 
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aufweist als zu einfach, aber dieser Unterschied ist vernachlässigbar). Auf jeden 
Fall liefern die Daten aber ein weiteres Indiz dafür, dass nicht einfach von einem 
Synonymieverhältnis zwischen eben und halt ausgegangen werden sollte. 


Tab. 10: Die externen Uniformitätswerte der Partikelpaare des Clusters 2b 


alle Belege alle Gesten abtönende Gesten 
eben - einfach 0,68 0,32 0,27 
einfach - halt 0,75 0,55 0,55 


eben - halt 0,70 0,37 0,28 


12.2 Distribution über die Datentypen 


12.2.0 Einführung 


Im Hinblick auf die Analyse der Faktoren, die die Distribution der Gesten beein- 
flussen können, soll zunächst auch ein Blick auf die Verteilung der Gesten über 
die Datentypen (Parlaments- versus Fernsehmaterialien) geworfen werden, da 
sich einige der im Abschnitt 12.3 zu besprechenden Faktoren auch damit ver- 
knüpfen lassen. Es sei von Anfang an daran erinnert, dass eine gewisse Verzer- 
rung des Bildes durch die regionale Verteilung der Korpusmaterialien nicht ganz 
auszuschließen ist, da bei den Parlamentsreden nur österreichische Daten vor- 
handen sind. Bei den Fernsehdaten (Talkshows und Sportberichten) dagegen 
handelt es sich zwar hauptsächlich um deutsche Aufnahmen, in denen allerdings 
auch österreichische Sprecher zu Worte kommen, sodass in diesem Fall nicht von 
einem dermaßen starken regionalen Einfluss auszugehen ist. Obwohl eine Veri- 
fizierung der Angaben zu den Parlamentsreden anhand deutscher Daten ein For- 
schungsdesiderat bleibt, lassen die Daten Tendenzen nachweisen, die vermut- 
lich nicht nur auf die geografische Distribution zurückzuführen sind. 

Um die im Folgenden zu machenden Vergleiche zu ermöglichen, wird im An- 
schluss an u. a. Priesters/Mittelberg (2013b) mit durchschnittlichen Frequenzan- 
gaben der Abtönungsformen (Gesten bzw. Partikeln) pro Minute gearbeitet. Dies 
hat gegenüber Angaben relativ zur Wortzahl, wie sie u. a. Cavicchio/Kita (2013) 
verwenden, den Nachteil, dass die Sprechgeschwindigkeit variieren kann, was 
auch seine Auswirkungen auf die Anzahl der Gesten pro Minute hat. Allerdings 
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dürfte dieses Problem durch die Anzahl unterschiedlicher Videodateien wenigs- 
tens zum Teil behoben worden sein. Zudem ist bei der Quote der Gestenzahl zur 
Wortzahl mit wenigstens genauso schwerwiegenden Problemen zu rechnen. Es 
wäre unter anderem zu klären, was man als ‚ein Wort‘ betrachtet und wie zum 
Beispiel mit komplexeren Einheiten, Häsitationen, Neustarts u. dgl. umzugehen 
ist. Zudem kann die Zahl der Wörter, die man verwendet, um eine Information zu 
vermitteln, je nach gewählter Formulierung erheblich variieren, während die 
Zahl der Gesten davon nicht unbedingt beeinflusst wird. Des Weiteren ist eine der 
zu vergleichenden Größen gerade eine verbale Ausdrucksform (Modalpartikeln). 
In der Hinsicht müssten für die Bestimmung der Wortzahl also eigentlich die Mo- 
dalpartikeln außer Betracht bleiben. Streng genommen müssten sogar alle ver- 
balen Abtönungsmittel außer Betracht bleiben, da abtönungsliierte Gesten (wie 
bereits gezeigt wurde) auch mit anderen Elementen einhergehen können, die 
eine abtönende Bedeutung vermitteln. Eine solche Arbeitsweise, bei der für die 
Bestimmung der Wortzahl alle verbalen Abtönungsmittel außer Betracht bleiben, 
erscheint jedoch als ziemlich unrealistisch, sodass immerhin für Frequenzanga- 
ben pro Minute optiert wurde. 

Im Folgenden sollen diese Frequenzangaben aus zweierlei Sicht besprochen 
werden. Zunächst (12.2.1) wird auf die Distribution der einzelnen Gesten über die 
Datentypen eingegangen, und in einem zweiten Schritt (12.2.2) wird der Frage 
nachgegangen, ob mit einer höheren Zahl abtönender Gesten auch eine Zunahme 
der Modalpartikelfrequenz einhergeht und umgekehrt. 


12.2.1 Allgemeine Distribution der Gesten 


In einem ersten Schritt wird die allgemeine Verteilung der abtönenden Gesten in 
Betracht gezogen, und zwar unabhängig davon, ob eine Modalpartikel vorliegt 
oder nicht. Eine Übersicht dieser Verteilung liefert Tabelle 11 sowie die dazuge- 
hörige Grafik in Abbildung 44. Die vier meistbelegten Gesten (Kopfschütteln, Ni- 
cken, intersubjektives Deiktikum und Beat) werden separat betrachtet; die ande- 
ren abtönenden Gesten, deren Einzelfrequenzen für eine detaillierte Analyse zu 
niedrig sind, werden unter den Nenner ‚sonstige Gesten‘ zusammengeführt. Zu 
Vergleichszwecken wird auch die Verteilung der illokutionstypbezogenen Gesten 
angegeben. 
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Tab. 11: Distribution der Gesten über die Datentypen 


Talkshows Sportberichte Parlamentsreden 
Kopfschütteln 0,99 0,87 0,04 
Nicken 1,56 0,45 0,12 
intersubjektives Deiktikum 0,23 0,13 0,24 
Beat 0,74 0,94 4,83 
sonstige Gesten 0,46 0,64 TEE a a a 
Illokutionstyp 0,97 1,11 2,63 


$ Kopfschütteln 
% Nicken 
& inters. Deikt. 


© Beat 


4 Sonstige Gesten 
 Illokutionstyp 


Talkshows Sportberichte Parlamentsreden 
Abb. 44: Distribution der Gesten über die Datentypen 


Wie die Angaben in der Tabelle zeigen, werden in den Parlamentsreden deut- 
lich mehr abtönende Gesten verwendet als in den Fernsehdaten (etwa ein Drittel 
mehr als in den Talkshows und fast doppelt so viele wie in den Sportberichten). 
Da die illokutionstypbezogenen Gesten ein vergleichbares Bild aufweisen, stellt 
sich die Frage, ob dies mit einer generell höheren Anzahl von Gesten in den Par- 
lamentsreden zu verknüpfen ist. Dies wäre insofern plausibel, als die Reden im 
Allgemeinen lebhafter und aufgeregter sind als die Fernsehgespräche. Eine Veri- 
fizierung dieser Annahme steht allerdings noch aus. 
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Allerdings könnte die höhere Frequenz der illokutionstypbezogenen Gesten 
zum Teil auch mit der höheren Frequenz der Beats in den Parlamentsdaten zu 
verknüpfen sein. In der Grafik zeigt sich eindeutig, dass die höhere Anzahl abtö- 
nender Gesten in den Parlamentsdaten nur auf die Frequenz der Beats zurückzu- 
führen ist; die anderen Frequenzen sind für die Parlamentsdaten nicht wesent- 
lich höher (vielfach sogar niedriger) als für die Fernsehdaten. Eine wichtige 
Erklärung für diesen hohen Beat-Anteil dürfte die für Parlamentsreden typische 
Aufregung sein: Diese zeigt sich vielfach darin, dass man dem eigenen Stand- 
punkt und den eigenen Argumenten extra Nachdruck verleiht, und gerade das ist 
die Funktion von Beats. Was die Beziehung zum Illokutionstyp angeht, sei an 
Ferrés (2010) These erinnert, dass die senkrechte flache Hand - wie sie bei der 
assertiv-hinstellenden Geste vorkommt - die Basishandform bei Beatgesten sei. 
Aufgrund der großen Formvielfalt bei Beatgesten lässt sich diese These zwar hin- 
terfragen, aber es ist nicht zu leugnen, dass die hinstellende Geste aufgrund ihrer 
inhärent nach unten gerichteten Bewegung eine Geste ist, die typisch mit einem 
Beat kombiniert werden kann. Insgesamt sind in den Parlamentsreden im Korpus 
155 Gesten zu finden, die als die Kombination eines Beats mit einer (meist hin- 
stellenden) illokutionstypbezogenen Geste zu interpretieren sind. Bei insgesamt 
1068 Beats in den Parlamentsreden ist das nur ein beschränkter Anteil (14,51%)°, 
was die Annahme rechtfertigt, dass Ferrés These wenigstens für das Deutsche 
nicht ganz stimmen dürfte, aber immerhin dürfte sie eine Rolle spielen bei der 
Beobachtung, dass sowohl die illokutionstypbezogenen Gesten als auch die 
Beats in den Parlamentsdaten wesentlich häufiger vertreten sind. 

Im Hinblick auf die anderen Gesten ist festzuhalten, dass die Frequenzen des 
intersubjektiven Deiktikums vom Datentyp nicht wesentlich beeinflusst werden. 
Auffälliger ist aber das Verhalten der Kopfgesten. Während die Beats und die il- 
lokutionstypbezogenen Gesten in der Tabelle und der Grafik von links nach 
rechts zunehmen, zeigen die Kopfgesten ein spiegelverkehrtes Bild: In den Fern- 
sehdaten wird im Durchschnitt fast jede Minute eine Kopfgeste (Kopfschütteln 
oder Nicken) eingesetzt, in den Parlamentsreden sind sie dagegen kaum belegt. 
Das eine dürfte mit dem anderen zu tun haben, aber im Falle der Kopfgesten sind 
vermutlich auch settingliierte Faktoren im Spiel, auf die im Abschnitt 12.3.4 aus- 
führlicher eingegangen wird. 


6 Illokutionstypbezogene Gesten gibt es in den Parlamentsdaten insgesamt 581, sodass es sich 
um einen wesentlich größeren (aber mit 26,68% immer noch nicht überwältigenden) Anteil der 
Illokutionstypgesten als der Beats handelt. 
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12.2.2 Gestische und verbale Abtönung 


Nachdem im vorigen Abschnitt die Distribution der abtönenden Gesten an sich 
besprochen wurde, soll jetzt diese Distribution mit der Verteilung der Modalpar- 
tikeln verglichen werden. Um eine direkte Vergleichsbasis zu gewährleisten, wer- 
den nur die ‚sichtbaren‘ Partikelbelege gezählt, da auch die Gesten nur in die 
Zählung aufgenommen werden können, wenn der Sprecher zu sehen ist. 

Tabelle 12 und die dazugehörigen Grafiken in den Abbildungen 45a-b liefern 
eine Übersicht der Distribution der analysierten Gesten und Modalpartikeln über 
die drei Datentypen.’ Eine Konstante in diesen Daten ist, dass die abtönenden 
Gesten zahlreicher sind als die Modalpartikeln. Allerdings sei daran erinnert, 
dass die Modalpartikeln nur eines der verbalen Abtönungsmittel darstellen; bei 
Berücksichtigung anderer verbaler Abtönungselemente wäre der Anteil der ver- 
balen Abtönung durchaus beachtlicher gewesen. Aus diesem Grund soll nicht 
weiter auf diese Tendenz eingegangen werden; wichtiger ist im Rahmen der vor- 
liegenden Arbeit die Frage, ob die Distribution der Gesten und jene der Partikeln 
die gleichen Tendenzen aufweisen. 

Wie die Angaben in der Tabelle und den Grafiken zeigen, wird in den Parla- 
mentsdaten insgesamt mehr Abtönung eingesetzt als in den Fernsehdaten. Dies 
ist vor allem auf die gestische Abtönung zurückzuführen, denn sowohl aus abso- 
luter (Abbildung 45a) als auch aus relativer (Abbildung 45b) Sicht werden in den 
Parlamentsdaten gerade die wenigsten Modalpartikeln eingesetzt. Erneut dürfte 
die hohe Gestenzahl mit der Beobachtung zu verknüpfen sein, dass in den Parla- 
mentsdaten infolge der Aufregung (bzw. allgemeiner infolge des rhetorischen 
Formats einer Parlamentsrede) weitaus mehr Beats eingesetzt werden. 


Tab. 12: Abtönende Gesten und Modalpartikeln (Frequenz pro Minute) 


Talkshows Sportberichte Parlamentsreden 
Gesten 3,98 3,04 5,75 


Partikeln 2,33 1,55 1,26 


7 Gezählt wurden sowohl die Belege mit monomodaler (d. h. rein verbaler oder rein gestischer) 
Abtönung als auch jene mit multimodaler Abtönung (Partikel + Geste). Eine Beschränkung auf 
die monomodalen Belege führt jedoch nicht zu einer wesentlichen Veränderung der Situation; 
lediglich die Dominanz der gestischen im Vergleich zur verbalen Abtönung wird leicht gestei- 
gert. 
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m Gesten 
= Partikeln 
ns 
Talkshows Sportberichte Parlamentsreden 
Abb. 45a: Abtönende Gesten und Modalpartikeln (1) 
# Partikeln 
m Gesten 


Talkshows Sportberichte Parlamentsreden 
Abb. 45b: Abtönende Gesten und Modalpartikeln (2) 


Wichtiger ist an dieser Stelle jedoch, dass keine parallelen Tendenzen in der 
Zahl der Modalpartikeln und der Zahl der abtönenden Gesten wahrzunehmen 
sind. Die Grafik in Abbildung 45a zeigt dies für die Ebene der Gattungen bzw. der 
Datentypen, aber auch ein Vergleich der einzelnen Videodateien führt nicht zu 
klaren Tendenzen diesbezüglich: Wenn in einer Aufnahme mehr abgetönt wird, 
zeigt sich das nicht unbedingt sowohl auf der verbalen als auch auf der gesti- 
schen Ebene. Sogar bei den stärkeren einzelnen Kookkurrenzmustern ist es - 
trotz der Stärke der Kookkurrenztendenzen - nicht so, dass zum Beispiel in einer 
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Aufnahme häufiger der Kopf geschüttelt wird, wenn die Partikel einfach häufiger 
eingesetzt wird und umgekehrt. Andererseits geht mehr gestische Abtönung aber 
auch nicht unbedingt mit weniger verbaler Abtönung einher (weder aus absolu- 
ter noch aus relativer Sicht, obwohl Abbildung 45b Letzteres zu suggerieren 
scheint). Eine verbale Kompensation der Abwesenheit abtönender Gesten (oder 
umgekehrt) ist also nicht nachzuweisen. Allerdings spielen für die Realisierung 
der Gesten mehrere externe Faktoren eine Rolle, wie im nächsten Abschnitt zu 
zeigen ist. Es ist nicht auszuschließen, dass gerade diese Faktoren dafür verant- 
wortlich sind, dass sich an dieser Stelle keine deutlichen Tendenzen nachweisen 
lassen.® 


12.3 Distributionsbestimmende Faktoren 


Im Laufe der Arbeit wurde bereits mehrfach darauf hingewiesen, dass bestimmte 
Faktoren die Distribution der abtönenden bzw. allgemeiner der abtönunsgsliier- 
ten Gesten beeinflussen dürften. Einer davon könnte die An- oder Abwesenheit 
eines verbalen Abtönungsmittels (sei es eine Modalpartikel oder nicht) sein, ob- 
wohl sich gerade gezeigt hat, dass sich in dieser Hinsicht keine eindeutigen Ten- 
denzen nachweisen lassen. Zum Teil dürfte das Fehlen einer klaren Tendenz auf 
dieser Ebene aber auch damit zu tun haben, dass auch andere Faktoren die Dis- 
tribution der Gesten im Korpus beeinflusst haben (bzw. haben könnten). Im wei- 
teren Verlauf dieses Kapitels soll eine Übersicht dieser Faktoren geliefert werden. 
Eingeteilt werden sie in fünf Gruppen: persönliche Faktoren (12.3.1), bedeutungs- 
bezogene Faktoren (12.3.2), physiologische Faktoren (12.3.3), Faktoren mit Bezug 
auf das Setting (12.3.4) und Faktoren, die sich auf die verbale Äußerung beziehen 
(12.3.5). Die Besprechung ist eher allgemein gedacht, d. h. unabhängig davon, ob 
eine Partikel vorliegt. Allerdings soll zum Schluss (12.3.6) noch der Frage nach- 
gegangen werden, inwiefern diese Faktoren in den Partikelbelegen ohne Geste 
die Abwesenheit der Geste erklären dürften. 


8 Die einzige nachweisbare Tendenz ist, dass in den live übertragenen Parlamentsreden sowohl 
mehr abtönende Gesten (6,30) als auch mehr Modalpartikeln (1,45) eingesetzt werden als in den 
nicht-ausgestrahlten Reden (5,19 bzw. 1,06). Die Unterschiede sind aber eher gering, sodass eine 
gewisse Vorsicht bei der Generalisierung geboten ist, zumal Zima (2011: 402) für eine umfangrei- 
chere Liste von Modalpartikeln eine - allerdings auch nicht ausnahmslos verallgemeinerbare - 
Tendenz nachweist, in den nicht live übertragenen Reden mehr Partikeln einzusetzen. 
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12.3.1 Personenbezogene Faktoren 


Eine Frage, die man sich insbesondere bei den selteneren Gestikmustern zu stel- 
len hat, ist die, inwiefern es sich um Idiosynkratische Phänomene handelt. Tat- 
sächlich unterliegt die gestische Ausdrucksebene nicht einer gleich starken Kon- 
ventionalisierung wie die verbale Ausdrucksebene. Dementsprechend sind 
besonders ikonische und metaphorische Gesten in hohem Maße von Idiosynkra- 
sie geprägt (vgl. Bohle 2007: 53). Allerdings sind alle in der vorliegenden Arbeit 
analysierten Gesten als rekurrente Gesten im Sinne von Ladewig (u. a. 2014) zu 
betrachten: Sie weisen eine gewisse Konventionalisierung auf und werden im 
Korpus von mehreren Sprechern (und meist auch in mehreren Datentypen) reali- 
siert. Es handelt sich also nicht um rein idiosynkratische Phänomene. 

Das soll jedoch nicht heißen, dass es keine Unterschiede zwischen den ein- 
zelnen Sprechern im Hinblick auf die Gestik gäbe. Jedes Individuum hat sein ei- 
genes Gestenverhalten: Eine Person gestikuliert mehr als die andere, und wäh- 
rend eine Person öfter bestimmte Gesten verwendet, setzt eine andere Person 
andere Gesten häufiger ein. Es kann sich um den eigenen Stil handeln, der sei- 
nerseits mit Faktoren wie Charakter und Persönlichkeit zu verknüpfen ist, aber 
auch etwaige persönliche Präferenzen (sofern sich diese nicht auf den Stil zu- 
rückführen lassen) können die Gestik beeinflussen.? 

Ähnlich ist die körperliche wie geistliche Verfassung der Sprecher zu erwäh- 
nen, da es sich um Faktoren handelt, die das allgemeine Verhalten von Personen 
(und dementsprechend vermutlich auch die Gestik) mit bestimmen. Die Chance, 
dass die Sprecher in den Korpusdaten unter Einfluss von Alkohol oder Drogen 
sind, scheint eher gering, aber die Gemütsverfassung und der Gesundheitszu- 
stand können durchaus eine Rolle spielen. Einer traurigen oder erkrankten Per- 
son dürfte zum Beispiel weniger nach Bewegung im Allgemeinen zumute sein, 
seien es Handlungen oder Gesten, und Nervenkrankheiten können die Bewe- 
gungsmuster einer Person an sich beeinträchtigen. Dazu passt auch die Beobach- 
tung, dass ein Sprecher im Korpus, von dem auch gesagt wird, er sei krank (OF 
in FG_B2a), kaum Gesten verwendet, seien sie abtönungsliiert oder nicht. 

Außer diesen persönlichen Faktoren können auch weitere personenbezo- 
gene Faktoren Einfluss auf die Gestik haben. Allen voran sind hier soziolinguis- 
tische Faktoren wie die Herkunft der Sprecher zu nennen. In den vorangehenden 
Analysen der einzelnen Gestikmuster wurde wiederholt darauf hingewiesen, 
dass Gesten sprach- bzw. kulturspezifisch sind, und besonders bei der Bespre- 
chung der ‚typisch italienischen‘ Börsenhand im Abschnitt 9.4 wurde suggeriert, 


9 Vgl. zur interpersönlichen Variation bei Gesten auch Lemmens’ (2015) Begriff ‚idiogests‘. 
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dass der regionalen Verbreitung der Geste durchaus Rechnung zu tragen ist. Wei- 
tere Faktoren, die sich weniger leicht kontrollieren lassen, sind u. a. Medientrai- 
ning und auferlegte Richtlinien (etwa vonseiten des Fernsehproduzenten) - und 
die Frage, inwiefern sich die Sprecher diesen ‚Instruktionsnormen‘ anpassen. Da 
diese auf Anweisungen zurückzuführenden Faktoren so schwer zu kontrollieren 
sind, soll jedoch an dieser Stelle nicht weiter darauf eingegangen werden. 

All diese Faktoren können mit für interpersönliche Unterschiede im Gesten- 
verhalten verantwortlich sein und dafür sorgen, dass jede Person seine eigene 
Art des Gestikulierens hat. Trotzdem kann nicht davon ausgegangen werden, 
dass es sich bei den analysierten Gesten um rein idiosynkratische Phänomene 
handelt: Sie werden durchaus von unterschiedlichen Sprechern in unterschied- 
lichen Kontexten eingesetzt. Dementsprechend lohnt es sich, im Folgenden kurz 
auf weitere Faktoren einzugehen, die bei der Distribution der Gesten eine Rolle 
spielen können. 


12.3.2 Bedeutung 


Es liegt auf der Hand, dass die Distribution der Gesten auch von ihrer Bedeutung 
abhängig ist: Ähnlich wie verbale Elemente setzt man Gesten im Normalfall nicht 
ein, wenn man deren Bedeutung nicht vermitteln möchte. Wenn also in einer Si- 
tuation eine bestimmte Bedeutung nicht realisiert wird, so werden auch keine 
Ausdrucksformen dieser Bedeutung (gestisch oder verbal) realisiert. 

Dies dürfte ein Teil der Erklärung für die Seltenheit des Kopfschüttelns inden 
Parlamentsreden sein. An dieser Stelle sei daran erinnert, dass das Kopfschütteln 
vor allem eine starke Beziehung zur Partikel einfach aufweist (vgl. Kapitel 8). 
Ähnlich wie das Kopfschütteln wird die Partikel einfach in den Parlamentsdaten 
deutlich seltener verwendet als in den Fernsehdaten (0,08 versus 0,54 in den 
Sportberichten und 0,31 in den Talkshows). Zwar besteht nicht unbedingt eine 
Korrelation zwischen der Frequenz einer Modalpartikel und der Frequenz einer 
eng damit zusammenhängenden Geste (vgl. Abschnitt 12.2.2), aber in diesem Fall 
dürfte sich die relative Seltenheit sowohl der Geste als auch der Partikel (zum 
Teil) durch einen Verweis auf die Bedeutung begründen lassen. Im Abschnitt 
2.3.3 sowie im Kapitel 7 wurde für die Beschreibung der Bedeutung von einfach 
auf Thurmairs (1989) Label der subjektiven bzw. sprecherbezogenen Evidenz zu- 
rückgegriffen. Gerade diese Sprecherbezogenheit dürfte der Grund dafür sein, 
dass das Kopfschütteln und die Partikel einfach weniger oft in den Parlamentsre- 
den eingesetzt werden: Wenn man das Publikum überzeugen möchte, dürften 
Aussagen, deren Inhalt als objektiv (und dementsprechend auch für den Hörer) 
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evident dargestellt wird, effizienter sein als subjektiv evidente Aussagen. Tat- 
sächlich ist zum Beispiel die Partikel eben etwas stärker vertreten als einfach (Fre- 
quenz 0,10 versus 0,08). Ähnlich dürfte auch die hohe Frequenz der Beats in 
den Parlamentsreden zum Teil mit der Bedeutung bzw. Funktion zu tun haben: 
Seinen Argumenten Nachdruck verleihen tut man vor allem, wenn man jeman- 
den überzeugen möchte, und gerade das ist typischer für Parlamentsdebatten als 
etwa für Sportberichte." Es dürfte deutlich sein, dass dieser Bedeutungsfaktor 
mit anderen Faktoren (Aufregung, Setting usw.) in einem engen Zusammenhang 
steht, denn gerade diese Faktoren können mitbestimmen, welche Bedeutungen 
vermittelt werden - und dementsprechend auch: für welche Bedeutungen eine 
(gestische oder verbale) Form eingesetzt wird. 

Im Rahmen dieser Besprechung der Bedeutung als distributionsbestimmen- 
den Faktors soll auch kurz an die Rolle der Grammatikalisierung erinnert werden. 
Tatsächlich kann sowohl der Grammatikalisierungsgrad einer Geste als auch je- 
ner des etwaigen lexikalischen Pendants die Verwendung einer Geste in be- 
stimmten Situationen plausibler oder gerade seltsamer machen. Da diese Rolle 
der Grammatikalisierung jedoch anderweitig in dieser Arbeit besprochen wird 
(für die Partikeln in den vorangehenden Kapiteln, für die Gesten in Kapitel 13), 
soll an dieser Stelle nicht weiter darauf eingegangen werden. 


12.3.3 Physiologische Faktoren 


Neben diesen personengebundenen und bedeutungsbezogenen Faktoren kön- 
nen auch externe Faktoren auf das Gestikverhalten des Sprechers eingreifen, und 
zwar vor allem, indem sie die Realisierung einer Geste erschweren oder gar ver- 
hindern. Zu nennen sind an erster Stelle einige physiologische Faktoren: Durch 


10 Dies ist insofern auffällig, als in den Fernsehdaten einfach deutlich häufiger vorkommt als 
eben (Frequenz 0,29 versus 0,85). Diese Distribution ist hochsignifikant: x?=13,28; p<0,001. 

11 Auch die Talkshows enthalten hauptsächlich ruhigere Gespräche und keine regen Debatten, 
in denen es wirklich gilt, den Gesprächspartner in einer lebhaften Diskussion zu überzeugen. An 
dieser Stelle soll auch auf McNeills (1992: 16) These hingewiesen werden, dass Beats die typi- 
schen Gesten in Parlamentsreden schlechthin seien, weil sie auch als Zeichen der Kohäsion der 
Rede dienen könnten. Dabei handelt es sich ebenfalls um eine auf die Bedeutung bzw. die Funk- 
tion der Geste bezogene Erklärung der Häufigkeit der Geste, denn eine solche Kohäsionsschöp- 
fung ist wohl in Parlamentsreden eher zu erwarten als etwa in Sportberichten (und außerdem ist 
diese Beobachtung nicht unbedingt mit der obigen, auf die Hervorhebungsfunktion verweisen- 
den These unverträglich, denn letztere dürfte der Grund dafür sein, dass gerade Beats als Kohä- 
renzzeichen eingesetzt werden). 
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die Beschränkungen der Beweglichkeit des menschlichen Körpers kann es unter 
Umständen schwer oder gar unmöglich sein, eine abtönende Geste zu realisieren. 

Dass es für die Zahl der realisierten Gesten eine Rolle spielt, inwiefern die 
Hände frei zum Gestikulieren sind, hat Bohle (2007: 35) bereits angedeutet. Als 
Beispiel erwähnt sie das gleichzeitige Ausführen einer Handlung: Wenn ein Spre- 
cher einfach erzählt, setzt er mehr Gesten ein als wenn er während des Erzählens 
eine Handlung ausführt, für die er die Hände braucht, da ihm in dem Fall die 
Hände nicht für die Realisierung von Gesten zur Verfügung stehen. Ähnlich ist 
die Situation, wenn der Sprecher ein Objekt in den Händen hat. Wenn es sich um 
ein kleines Objekt wie einen Kugelschreiber handelt, hat das nicht unbedingt grö- 
Beren Einfluss auf das Gestikverhalten, aber größere Objekte können durchaus 
die Bewegungsfreiheit des Sprechers reduzieren (vgl. auch Bavelas u. a. 1992: 
481). In den Sportberichten halten die Sprecher zum Beispiel häufig selber ihr 
Mikrofon. In dem Fall steht wenigstens die Hand, in der das Mikrofon gehalten 
wird, nicht für Gesten zur Verfügung (vgl. Abbildung 16 in Kapitel 8). 

Die Wichtigkeit dieses Faktors sollte nicht unterschätzt werden, denn in 175 
der 410 (= 42,68%) Partikelbelege ohne Gestik (sei sie abtönunsgsliiert oder nicht) 
hält der Sprecher tatsächlich ein Objekt oder übt eine Handlung aus. Auffällig ist 
jedoch, dass es sich auch um Belege handelt, in denen nur eine Hand nicht zur 
Verfügung steht, während mit der anderen Hand durchaus eine Geste hätte rea- 
lisiert werden können (wie etwa in Abbildung 16 in Kapitel 8 zu sehen ist). Ähn- 
lich kann bei beschränkter Bewegungsfreiheit der Hände durchaus eine Kopfge- 
ste realisiert werden, aber trotzdem ist in nur 32 dieser Belege mit beschränkter 
Bewegungsfreiheit eine Kopfgeste vorhanden, gegenüber 175 Belegen ohne 
Geste. Dies zeigt, dass neben der Beschränkung der Bewegungsfreiheit auch wei- 
tere Faktoren eine Rolle spielen. 

Des Weiteren wäre noch zu klären, ob sich diese Tendenz (weniger Gesten, 
wenn man etwas in den Händen hält) auf diejenigen Fälle ausweiten lässt, in de- 
nen ikonisch oder metaphorisch ein Objekt gehalten wird, wie das etwa bei den 
illokutionstypbezogenen Gesten der Fall ist. Dies führt nahtlos zum nächsten 
Punkt, dem Einfluss anderer Gesten, denn auch das ikonische oder metaphori- 
sche Halten eines Objektes ist im Grunde genommen eine Geste. In Kapitel 8 
wurde darauf hingewiesen, dass das intersubjektive Deiktikum später einsetzen 
kann, wenn eine andere Geste (zu der gleichen oder der vorigen Intonationsein- 
heit) vorangeht. Es ist auch möglich, dass bei der Realisierung einer anderen 
Geste keine abtönungsliierte Geste produziert wird. Ob hier eine richtige kausale 
Beziehung anzusetzen ist, ist schwer zu sagen, weil dafür zunächst geklärt wer- 
den müsste, wie die Entscheidung getroffen wird, zu welchen Elementen der ver- 
balen Äußerung eine Geste realisiert wird (oder welche Elemente der verbalen 
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Äußerung gestisch hinzugefügt werden) - eine Frage, die durch ihren psycholo- 
gischen Einschlag den Skopus der vorliegenden Arbeit weit übersteigt. Inwiefern 
die Realisierung nicht-abtönungsliierter Gesten wirklich als Grund für die Abwe- 
senheit abtönungsliierter Gesten zu sehen ist, muss also dahingestellt bleiben, 
aber auf jeden Fall wirft sie ein interessantes Licht auf die Distribution der abtö- 
nungsliierten Gesten, da in fast einem Drittel der Belege ohne abtönunsgsliierte 
Geste (162 von 572) durchaus eine andere Geste nachzuweisen ist. 

Erschwert wird die Angelegenheit noch dadurch, dass Gesten miteinander 
kombiniert werden können (sofern sie von der Bedeutung her kompatibel sind). 
Auch hier sind allerdings physiologische Beschränkungen zu nennen. Nicht nur 
kann nicht jede abtönungsliierte Geste einfach mit jeder nicht-abtönungsliierten 
Geste kombiniert werden, auch Kombinationen abtönender Gesten untereinan- 
der sind aus physiologischen Gründen manchmal unwahrscheinlich oder gar un- 
möglich. Die Kombination eines abtönenden Kopfschüttelns mit einem Beat ist 
zum Beispiel im Korpus nicht ein einziges Mal belegt, während ihre Bedeutungen 
nicht miteinander unverträglich sind. Die Erklärung dürfte in der Kombination 
des Richtungsunterschieds und des Rhythmusunterschieds zu finden sein: Das 
Kopfschütteln beschreibt eine waagerechte Bewegung mit einem eigenen, kon- 
stanten Rhythmus, der Beat dagegen eine senkrechte Bewegung, die dem Sprech- 
rhythmus folgt. Obwohl eine senkrechte und eine waagerechte Geste durchaus 
kombiniert werden können, sind Kombinationen von Gesten mit einer Bewegung 
in derselben Richtung durchaus einfacher zu realisieren, und eine Kombination 
des Kopfschüttelns mit dem Beat führt fast zwangsmäßig dazu, dass eine Geste 
(typischerweise das Kopfschütteln) den Rhythmus der anderen übernimmt. Die- 
ser doppelte Konflikt scheint eine Kombination von Kopfschütteln und Beat eher 
unwahrscheinlich zu machen.” 


12.3.4 Settingliierte Faktoren 


In den vorigen Abschnitten wie auch in den vorangehenden Kapiteln wurde be- 
reits mehrfach auf das Setting als gestikbeeinflussenden Faktor hingewiesen. Im 


12 Obwohl es gewiss nicht die einzige Erklärung ist, dürfte sich diese Beobachtung auch mit der 
relativen Seltenheit des Kopfschüttelns in den Parlamentsreden verknüpfen lassen, eben auf- 
grund der hohen Frequenz der Beats in diesen Daten (obwohl noch zu klären wäre, in welcher 
Richtung die Kausalität zu sehen ist). 
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Grunde genommen handelt es sich jedoch nicht um einen einzigen Faktor; viel- 
mehr sind eine Reihe von Aspekten des Settings zu nennen, die alle Einfluss auf 
die Realisierung von Gesten haben können. 

Ein erster Aspekt betrifft die Formalität des Settings. In der Partikelforschung 
wird im Allgemeinen davon ausgegangen, dass Modalpartikeln vor allem in eher 
informellen Kontexten eingesetzt werden. Aufgrund der funktionalen Überein- 
stimmung könnte man die Hypothese formulieren, dass auch abtönende Gestik 
eher für informelle Interaktionen typisch wäre. Im Anschluss an die Beobachtung 
aus Abschnitt 12.2.2, dass die Frequenz von Modalpartikeln und abtönenden Ges- 
ten nicht deutlich miteinander korreliert, stellt sich jedoch heraus, dass im Kor- 
pus keine eindeutigen Tendenzen diesbezüglich wahrzunehmen sind. 

Eng damit verwandte Faktoren sind die An- oder Abwesenheit von Kameras 
(bzw. die Frage, ob die Parlamentsreden live übertragen werden oder nicht, vgl. 
Fußnote 8), die mehr oder weniger interaktive Natur (eher monologisch oder di- 
alogisch) des Settings sowie die Frage, inwiefern das Gesagte spontan oder vor- 
bereitet ist. In den beiden letzteren Fällen dürfte dies jedoch auch mit der Bedeu- 
tung der Gesten im Zusammenhang stehen: In vorbereiteten Reden sind zum 
Beispiel Wortsuchen seltener, und dementsprechend dürften sich auch weniger 
metasprachliche Kopfschütteln vorfinden lassen. Allerdings ist die Zusammen- 
stellung des Korpus nicht darauf ausgerichtet, diese Faktoren eingehend zu un- 
tersuchen, sodass an dieser Stelle nicht weiter darauf eingegangen werden kann. 

Auch Aspekte der konkreten Gesprächssituation können das Gestenverhal- 
ten der Sprecher beeinflussen, etwa Faktoren, die den verfügbaren Gestenraum 
reduzieren und so die Bewegungsfreiheit einschränken. Zu erwähnen ist zum 
Beispiel das Rednerpult, das die Realisierung von Gesten im unteren Peripherie- 
bereich des Gestenraums verhindert. Allerdings lassen sich in dieser Hinsicht 
keine eindeutigen Tendenzen auf die Zahl der realisierten Gesten im Korpus 
nachweisen, was damit zu tun haben dürfte, dass die meisten analysierten 
Gestikmuster eher ‚klein‘ sind und dementsprechend weniger von Einschränkun- 
gen der Bewegunssfreiheit in der unteren Peripherie betroffen sind. 

Eng damit verknüpft ist auch die Frage, ob der Sprecher steht oder sitzt, denn 
im letzteren Fall ist durchaus auch von einer Beschränkung des Gestenraums 
auszugehen. Zima (2013: 21) gibt an, dass dieser Aspekt der Körperhaltung keinen 
eindeutigen Einfluss auf die Zahl der realisierten Gesten hat. Diese Beobachtung 
sieht sich in meinem Korpus bestätigt: Die stehenden Sprecher setzen zwar etwas 
mehr Gesten ein als die sitzenden, aber diese Tendenz ist wenigstens für die par- 
tikelhaltigen Äußerungen nicht signifikant (X2=2,76; siehe aber Abschnitt 12.3.6). 
Für die Frage, welche Gesten realisiert werden, scheint es dagegen durchaus eine 
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Rolle zu spielen, ob der Sprecher steht oder sitzt. In letzterem Fall werden näm- 
lich häufiger reine Kopfgesten eingesetzt, während stehende Sprecher häufiger 
Handgesten (oder eine Kombination von Hand- und Kopfgesten) verwenden. Bei 
den im Sitzen geäußerten Modalpartikeln wird in 48 der 137 Fälle, die überhaupt 
mit einer abtönungsliierten Geste einhergehen, nur eine Kopfgeste realisiert 
(= 35,04%), während es sich bei den stehend geäußerten Partikeln um 28 von 206 
Belegen handelt (13,59%). Diese Distribution ist eindeutig signifikant (X?=20,71; 
p<0,001). 

Auch der Umfang des Settings könnte eine Rolle spielen. In dieser Hinsicht 
könnte die relative Seltenheit der Kopfgesten (Kopfschütteln, Nicken) in den Par- 
lamentsdaten zum Teil auch darauf zurückzuführen sein, dass es sich um eher 
subtile Gesten mit einer beschränkten Amplitude handelt. In einem größeren Set- 
ting wie dem Plenarsaal des Parlamentes erscheint das Einsetzen dieser Gesten 
somit als eher sinnlos, da die meisten Zuhörer sie nicht einmal wahrnehmen kön- 
nen dürften. Allerdings stellt sich die Frage, inwiefern sich die Sprecher dessen 
bewusst sind, zumal bekannt ist (u. a. Bohle 2007: 143), dass auch gestikuliert 
wird, wenn der Hörer einen gewiss nicht sehen kann, zum Beispiel am Telefon - 
obwohl Bavelas u. a. (2008) zufolge interaktive Gesten in solchen Situationen 
schon seltener sind. Auch hier ist weitere Forschung notwendig, aber vermutlich 
sollte die Wichtigkeit dieses Faktors nicht überschätzt werden. 

Durchaus wichtiger dürfte eine andere Facette des Umfangs des Settings 
sein: Die Zahl der Gesprächspartner (bzw. Zuhörer) und deren Position im Raum 
vis-à-vis dem Sprecher. In Kapitel 8 wurde bereits suggeriert, dass dies für meh- 
rere Aspekte der Form des intersubjektiven Deiktikums (verwendete Hand, Rich- 
tung, etwaige Bewegung) eine Rolle spielt, aber auch ein weiterer Teil der Erklä- 
rung der relativen Seltenheit der Kopfgesten in den Parlamentsdaten dürfte hier 
zu finden sein. Dadurch, dass die Zuhörer in einem großen halben Kreis dem Red- 
ner gegenübersitzen, ist es kaum möglich für den Redner, sie alle zugleich anzu- 
schauen. Daher merkt man, dass die Redner fast dauernd die Blickrichtung än- 
dern, was zu einer hohen Zahl an Kopfbewegungen führt. Wenn man allerdings 
dauernd den Kopf bewegt, ist es schwieriger, zugleich auch Kopfgesten zu reali- 
sieren. Diese Beobachtung ist wieder mit den oben angesprochenen physiologi- 
schen Beschränkungen zu verknüpfen: Eine Bewegung bzw. Handlung (das Her- 
umschauen im Saal) erschwert oder verhindert die Realisierung einer Kopfgeste. 

Aus dieser Beobachtung ergibt sich die Frage, ob die relative Seltenheit der 
Kopfgesten im Parlament durch ein Mehr an anderen Gesten kompensiert wird, 
die das gleiche Verhältnis zum im Abschnitt 9.5 beschriebenen Kinaesthem auf- 
weisen. Als Stichprobe kann hier das Kopfschütteln herangezogen werden. Das 
Achselzucken ist ähnlich wie das Kopfschütteln in den Parlamentsreden seltener 
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vertreten (Frequenz 0,15 gegenüber 0,32 in den Talkshows und 0,60 in den Sport- 
berichten) - ob dies auf die Bedeutungsähnlichkeit mit dem Kopfschütteln zu- 
rückzuführen ist oder doch vielmehr auf die Tatsache, dass auch ein Achselzu- 
cken physiologisch schwieriger mit einem Beat zu kombinieren ist, muss an 
dieser Stelle dahingestellt bleiben. Die Gestikmuster, die ähnlich wie das Kopf- 
schütteln eine waagerechte Bewegung beschreiben (PL und ZP), sind dagegen in 
den Parlamentsreden durchaus stärker vertreten (Gesamtfrequenz 0,26 gegen- 
über 0,08 in den Talkshows und 0,04 in den Sportberichten). Damit ist die Fre- 
quenz dieser Gesten in den Parlamentsreden immer noch deutlich niedriger als 
jene des Kopfschüttelns in den Fernsehdaten (0,99 in den Talkshows, 0,87 in den 
Sportberichten), aber durchaus wesentlich höher als die Frequenz des Kopf- 
schüttelns in den Parlamentsdaten (0,04). Diese Distribution ist hochsignifikant 
(x?=213,84; p<0,001). Allerdings ist in diesem Fall nur schwer zu bestimmen, ob 
tatsächlich eine Art Kompensation stattfindet oder ob es sich nicht eher um eine 
Bedeutungsfrage im Sinne von Abschnitt 12.3.2 handelt, denn tatsächlich sind PL 
und ZP nicht ganz mit dem Kopfschütteln synonym: Sie stehen eher der in Parla- 
mentsreden sowieso frequenteren Partikel eben nahe als der mit dem Kopfschüt- 
teln zu verknüpfenden Partikel einfach, was seinerseits mit der weniger stark 
sprecherorientierten und daher in persuasiven Kontexten besser geeigneten Be- 
deutung ersterer Partikel zu tun haben dürfte. 

Als letzter Faktor in dieser Reihe ist das Gestikverhalten der Gesprächs- 
partner zu erwähnen, denn es ist nicht auszuschließen, dass hier ‚Alignment‘ 
(‚Angleichung‘) stattfindet. Gemeint ist damit, dass sich ein Sprecher dem ande- 
ren anpasst, indem er zum Beispiel bestimmte referentielle Gesten von dem Ge- 
sprächspartner übernimmt (vgl. u. a. Oben/Bröne 2015). Ob auch bei den abtö- 
nungsliierten Gesten eine Angleichung auf der Ebene der Form (bzw. bei der 
Wahl der Geste) nachweisbar ist, muss allerdings dahingestellt bleiben, genauso 
wie die Antwort auf die Frage, ob bei der Zahl der realisierten Gesten Angleichung 
stattfindet: Die Datenmenge pro Sprecher im Korpus ist in den meisten Fällen zu 
beschränkt, um darüber Aussagen machen zu können. 


12.3.5 Inhalt der verbalen Äußerung 


Zum Schluss sei auf einige Aspekte der verbalen Äußerung bzw. ihres Inhalts ein- 
gegangen, da auch diese Einfluss auf die Distribution der abtönungsliierten Ges- 
ten haben dürften. Zu erwähnen sind das Thema der Äußerung sowie die Quelle 
und die etwaige Wiederholung der verbalen Abtönung. 
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Im Hinblick auf das Thema ist festzuhalten, dass Levy/McNeill (1992, s. auch 
McNeill/Levy 1993) zufolge bei einem thematischen Übergang - und insbeson- 
dere bei der Einführung eines neuen Referenten - mehr Gesten realisiert werden. 
Dies betrifft insbesondere die Partikel eigentlich, die gerade zur Markierung von 
Themenwechseln eingesetzt wird. Dass abtönungsunterstützende Gesten wie das 
referentielle Deiktikum in solchen Kontexten eine Rolle spielen können, wurde 
im Abschnitt 10.1 bereits gezeigt. Inwiefern auch abtönende Gesten in diesen 
Kontexten häufiger eingesetzt werden, bleibt allerdings noch zu klären. 

Die Quelle der Modalität wurde ebenfalls in den vorangehenden Kapiteln be- 
reits mehrfach angesprochen. Die Idee ist, dass Sprecher weniger abtönende Ges- 
ten (oder gar weniger Gesten im Allgemeinen) einsetzen, wenn sie nicht selber 
für den Inhalt der Äußerung verantwortlich sind. Betrachtet man zum Beispiel 
die 22 Belege von Partikeln in Zitaten im Korpus, so fällt auf, dass in 15 davon 
keine abtönunsgsliierte Geste realisiert wird, und in fünf der sieben anderen Fälle 
ist die Geste als illokutionstypbezogen einzustufen. Dieses Bild wird bestätigt, 
wenn man auch die anderen Fälle der Kontextverschiebung einbezieht (nur in 12 
von 26 kontextverschobenen Belegen liegt eine abtönungsliierte Geste vor, und 
in der Hälfte der Fälle ist diese Geste als rein illokutionstypbezogen zu betrach- 
ten). Es sieht also danach aus, dass Sprecher weniger (abtönende) Gesten einset- 
zen, wenn sie nicht selber für die Abtönung verantwortlich sind.” 

Als letzter Faktor ist die Wiederholung zu nennen. Tatsächlich wurde im vo- 
rigen Kapitel gezeigt, dass bei einer Wiederholung der Partikel in aufeinanderfol- 
genden Äußerungen die Geste nicht unbedingt jedes Mal neu realisiert wird. Da 
die Rolle der Wiederholung im vorigen Kapitel ausführlicher besprochen worden 
ist, soll an dieser Stelle jedoch nicht weiter darauf eingegangen werden. 


12.3.6 Erklärungsstärke 


In den vorangehenden Abschnitten ist die Besprechung der einzelnen Faktoren 
zum Teil hypothetisch geblieben und nicht jedes Mal mit konkreten Zahlen un- 
termauert worden. Dies hat damit zu tun, dass einige Faktoren kaum objektiv 
feststellbar sind (u. a. Gemütsverfassung), nur schwer verifizierbar sind (u. a. Me- 
diatraining) oder dermaßen komplex sind, dass eine detaillierte Studie ein Buch 
für sich wäre (u. a. Umfang des Settings). Für diejenigen Faktoren, die durchaus 


13 Interessant wäre, der Frage nachzugehen, ob sich die Angaben zu den Zitaten auch aufnicht- 
abtönungsliierte Gesten ausdehnen lassen, was auf eine allgemeinere Tendenz hinweisen 
würde, dass man nur die verbale Äußerung, nicht jedoch die dazugehörige Gestik zitiert. 
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eindeutig bestimmt werden können, soll im Folgenden ein Indiz der Erklärungs- 
stärke geliefert werden, indem sie auf die Distribution der Gesten bei den Modal- 
partikeln angewandt werden. Konkret wird der Einfluss dieser Faktoren auf drei 
Fragen analysiert: (1) Liegt eine abtönungsliierte Geste vor oder nicht, und wenn 
ja, (2) handelt es sich um eine Kopf- oder eine Handgeste und (3) ist die Geste als 
abtönend zu betrachten? Die Faktoren, die in die Analyse einbezogen werden, 
sind die Realisierung einer anderen Geste, die physiologische Einschränkung der 
Bewegungsfreiheit durch eine Handlung oder ein Objekt, die Kontextverschie- 
bung, die Wiederholung der Partikel (handelt es sich um den ersten Beleg oder 
um einen späteren?) und die Körperhaltung (stehend oder sitzend). 

Die erste Frage ist die, inwiefern diese Faktoren mitbestimmen, wann eine 
abtönunsgsliierte Geste zu einer Partikel realisiert wird und wann nicht. Tabelle 
13 liefert sowohl für die Partikelbelege mit einer Geste als auch für die Belege 
ohne Geste eine Übersicht der Anzahl der Belege, die von wenigstens einem die- 
ser Faktoren betroffen sind (Haltung ist hier außer Betracht geblieben, da man 
bei dem Faktor nicht sagen kann, er treffe zu oder nicht, sondern nur bestimmen 
kann, ob der Sprecher steht oder sitzt). Es zeigt sich, dass bei gut zwei Dritteln 
der Partikelbelege ohne Geste wenigstens einer dieser Faktoren im Spiel ist, wäh- 
rend das bei den Belegen mit einer Geste nur gut ein Drittel ist. Diese Ergebnisse 
sind eindeutig signifikant (X?=88,27; p<0,001), was zeigt, dass diesen Faktoren 
bei der Analyse der Distribution der abtönungsliierten Gesten durchaus Rech- 
nung zu tragen ist. 


Tab. 13: Anteil der von den Faktoren betroffenen Partikelbelege 


ohne Geste mit Geste 
betroffen % betroffen betroffen % betroffen 
denn 36/56 64,29% 2/8 25,00% 
doch 31/53 58,49% 11/32 34,38% 
eben 20/37 54,05% 8/26 30,77% 
eigentlich 13/17 76,47% 2/8 25,00% 
einfach 44/73 60,27% 29/64 45,31% 
halt 31/43 72,09% 7/26 26,92% 
ja eat 209/293 nn AN ran ST a O ne 


Summe 384/572 67,13% 120/343 34,99% 


Allerdings stellt sich noch die Frage, wie der Einfluss einzelner Faktoren un- 
ter multifaktorieller Kontrolle zu sehen ist bzw. welche Faktoren die wichtigsten 
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sind. Um dies herauszufinden, wurde mit diesen Faktoren eine Regressionsana- 
lyse durchgeführt.“ Um allzu starker Beeinflussung der Ergebnisse durch etwa- 
ige Idiosynkrasien vorzubeugen (vgl. u. a. Gries 2015) und so zu einer genaueren 
Schätzung der eigentlichen (‚fixed‘) Effekte zu kommen, wurde der Parameter 
‚Sprecher‘ als sogenannter ‚random effect‘ modelliert. Da an dieser Stelle der Ein- 
fluss der Faktoren im Allgemeinen betrachtet werden soll, d. h. ohne Differenzie- 
rung nach Partikel, wurde auch ‚Partikel‘ als ‚random effect‘ aufgenommen. Die 
Ergebnisse der Regression sind Tabelle 14a zu entnehmen. 


Tab. 14a: Ergebnisse der Regression zur Gestenrealisierung (‚Sprecher‘ als ‚random effect‘) 


Estimate Std. Error z value Pr(>]z]) 


(Intercept) 0.1622 0.4852 0.334 0.738 
ANDERE GESTE 

nein > ja -4.2482 0.5971 -7.115 1.12e-12 *** 
BEWEGUNGSFREIHEIT 

frei > eingeschränkt -0.9465 0.2158 -4.386 1.15e-05 *** 
KONTEXTVERSCHIEBUNG 

ja > nein -0.2065 0.4177 -0.494 0.621 
WIEDERHOLUNG 

erste Partikel > Wiederholung -0.2082 0.3370 -0.618 0.537 
HALTUNG 


stehend > sitzend -0.2885 0.2721 -1.060 0.289 


Diese Regression wurde so erstellt, dass die Realisierung einer abtönungsli- 
ierten Geste vorhergesagt wird, und dass mit anderen Worten ein positiver Wert 
in den Spalten ‚Estimate‘ und ‚z value‘ mit Gestenrealisierung zu verknüpfen ist. 
Ein negativer Wert zeigt dagegen eine Tendenz, unter diesen Umständen gerade 
keine abtönungsliierte Geste zu produzieren. Alle einbezogenen Faktoren sind 
mit einer solchen Tendenz zu verknüpfen, aber wie die Werte in der letzten Spalte 
zeigen, ist dieser Einfluss nur bei zwei Faktoren signifikant: Es werden deutlich 
weniger abtönungsliierte Gesten realisiert, wenn eine andere Geste im Spiel ist 
und wenn die Gestikulierfreiheit des Sprechers durch eine Handlung oder das 
Halten eines Objektes eingeschränkt wird. Nicht signifikant sind die Faktoren der 


14 Durchgeführt wurde die Regression in R (http://www.R-project.org) mit der Funktion gimer. 
Für das Erstellen der Effektplots wurde das Paket effects (http://www.jstatsoft.org/v08/i15/) ver- 
wendet. 
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Kontextverschiebung und der Wiederholung. Das Ergebnis zur Kontextverschie- 
bung ist einigermaßen auffällig, dürfte aber darauf zurückzuführen sein, dass 
zwar abtönende Gesten, nicht jedoch illokutionstypbezogene Gesten bei den kon- 
textverschobenen Partikeln deutlich seltener sind (vgl. unten). 

Ebenfalls nicht signifikant ist nach diesem Modell der Parameter ‚Haltung‘ 
(ob der Sprecher steht oder sitzt). Wenn jedoch der Faktor ‚Sprecher‘ nicht als 
‚random effect‘ aufgenommen wird, tritt die Haltung als durchaus signifikant 
hervor (Tabelle 14b). Dies dürfte damit zu tun haben, dass die meisten Sprecher 
nur im Stehen oder im Sitzen gefilmt wurden und dass also eine gewisse Korrela- 
tion zwischen den Parametern ‚Sprecher‘ und ‚Haltung‘ vorliegt. Die Tendenz, 
die sich zeigt, ist, dass Sprecher im Sitzen weniger abtönungsliierte Gesten reali- 
sieren als stehende Sprecher, was an sich nicht verwunderlich ist, da Sitzen auch 
die Bewegungsfreiheit etwas einschränkt. Allerdings ist die Signifikanz dieser 
Tendenz auch im Alternativmodell in Tabelle 15 geringer als jene der anderen sig- 
nifikanten Faktoren (andere Geste und eingeschränkte Gestikulierfreiheit). 


Tab. 14b: Ergebnisse der Regression zur Gestenrealisierung (‚Sprecher‘ nicht als ‚random effect‘) 


Estimate Std. Error z value Pr(>|z]) 

(Intercept) 0.20855 0.42298 0.493 0.62197 
ANDERE GESTE 

nein > ja -4.03386 0.59022 -6.834 8.23e-12 *** 
BEWEGUNGSFREIHEIT 

frei > eingeschränkt -0.95165 0.17653 -5.391 7.01e-08 *** 
KONTEXTVERSCHIEBUNG 

ja > nein 0.03229 0.38938 0.083 0.93391 
WIEDERHOLUNG 

erste Partikel > Wiederholung -0.05469 0.32027 -0.171 0.86441 
HALTUNG 


stehend > sitzend -0.54777 0.16720 -3.276 0.00105 ** 


Die grafische Darstellung der Interaktionseffekte in Abbildung 46 (mit ‚Spre- 
cher‘ als ‚random effect‘) bestätigt die gerade beschriebenen Tendenzen: Die Re- 
alisierung einer anderen Geste (‚AG‘) und die etwaige Beschränkung der Gestiku- 
lierfreiheit (‚GS_JN‘) haben einen deutlichen Einfluss auf die Gestendistribution, 
die anderen Faktoren eher weniger. Dies zeigt sich darin, dass bei ‚AG‘ und 
‚GS_JN‘ die senkrechten Linien für die einzelnen Parameterwerte (‚n_AG‘ und 
‚AG‘ bzw. ‚N‘ und ‚J‘) völlig oder nahezu völlig unterschiedliche Bereiche der y- 
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Achse (‚Geste_JN‘) abdecken, während sie sich bei den anderen Faktoren stärker 
überlappen. 
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Abb. 46: Effektplots der Regression zur Gestenrealisierung (‚Sprecher‘ als ‚random effect‘) 

(AG = andere Geste, n_AG = keine andere Geste; J = beschränkte Gestikulierfreiheit durch Hand- 
lung oder Objekt, N = frei zum Gestikulieren; KV = kontextverschoben, n_KV = nicht kontextver- 
schoben; n_Wdh = erste Partikelrealisierung, Wdh = wiederholte Realisierung; stehend = Spre- 
cher steht; sitzend = Sprecher sitzt) 


Zumindest einige der herangezogenen Faktoren scheinen also eine nicht zu 
vernachlässigende Rolle für die Distribution der Gesten zu spielen. Allerdings 
können diese Faktoren nicht in allen Fällen die Abwesenheit einer Geste erklä- 
ren, zumal sie nur auf zwei Drittel der gestenlosen Partikelbelege überhaupt zu- 
treffen (siehe Tabelle 13). Es müssen also noch andere Faktoren im Spiel sein, 
darunter vermutlich auch Faktoren wie die Gemütsverfassung und der Umfang 
des Settings, die zwar oben auch besprochen worden sind, allerdings nicht in die 
Regressionsanalyse einbezogen werden konnten. Für ein vollständiges Bild 
bleibt also weitere Forschung notwendig. 
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Die zweite Regression betrifft die Frage, ob die Geste (wenn überhaupt eine 
realisiert wird) eine Kopfgeste oder eine Handgeste - oder eine Kombination der 
beiden - ist. Im Rahmen der vorliegenden Analyse konnte nur zwischen Gesten 
mit den Händen (also Handgesten wie kombinierte Kopf-Hand-Gesten) und rei- 
nen Kopfgesten unterscheiden werden (das Achselzucken wurde zu den Handge- 
sten gezählt); eine weitere Trennung zwischen den reinen Handgesten und den 
kombinierten Gesten vorzunehmen, ist im Rahmen der vorliegenden Arbeit nicht 
möglich, ist im Hinblick auf die Forschungsfragen aber auch weniger relevant. 

Tabelle 15a zeigt die Ergebnisse der Regression. Nur die zwei Faktoren, die 
am ehesten für diese Frage relevant sind (die Haltung und die etwaige Einschrän- 
kung der ‚Gestikulierfreiheit‘ durch eine Handlung oder ein Objekt), wurden in 
die Abbildung aufgenommen. Positive Werte sprechen in diesem Fall für Kopfge- 
sten, während negative Werte mit Handgesten (oder kombinierte Kopf-Hand-Ges- 
ten) in Verbindung zu bringen sind. Aus den Daten spricht eine Tendenz, Hand- 
gesten vor allem im ‚Intercept‘-Fall zu verwenden, das heißt: wenn der Sprecher 
steht und in seiner Bewegungsfreiheit nicht durch Objekte oder Handlungen ein- 
geschränkt wird. Dies ist an sich einleuchtend: Kopfgesten sind nicht von der Be- 
wegungsfreiheit der Hände betroffen und können immer eingesetzt werden, wäh- 
rend Handgesten nur verwendet werden können, wenn die Hände dafür zur 
Verfügung stehen. 


Tab. 15a: Ergebnisse der Regression zu den Artikulatoren (‚Sprecher‘ als ‚random effect‘) 


Estimate Std. Error z value Pr(>|z]) 
(Intercept) -1.8540 0.7212 -2.571 0.0101 * 
BEWEGUNGSFREIHEIT 
frei > eingeschränkt 0.5426 0.7121 0.762 0.4461 
HALTUNG 


stehend > sitzend 0.7886 0.8541 0.923 0.3558 


Diese Tendenz ist allerdings nicht gerade hochsignifikant und ihr Effekt 
sollte nicht überschätzt werden, wie auch die Effektplots in Abbildung 47a zeigen 
(große Überlappung der senkrechten Linien, also kein großer Unterschied der Ef- 
fektbereiche). Dies dürfte eben auf die Tatsache zurückzuführen sein, dass sich 
die Tendenz nur auf die Handgesten auswirkt, während Kopfgesten auch verwen- 
det werden können, wenn die Realisierung von Handgesten nicht durch eine ein- 
geschränkte Bewegungsfreiheit der Hände erschwert oder verhindert wird. Au- 
ßerdem ist erneut darauf hinzuweisen, dass die meisten Sprecher nur entweder 
im Stehen oder im Sitzen gefilmt wurden, und dass also eine enge Korrelation 
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zwischen der Haltung und dem ‚random effect‘ ‚Sprecher‘ vorliegt. Tatsächlich 
wird, wie bei der ersten Regressionsfrage, die Tendenz stärker, wenn man ‚Spre- 
cher‘ nicht als ‚random effect‘ aufnimmt (vgl. Tabelle 15b und Abbildung 47b). 
Vermutlich spielt die Haltung also durchaus eine Rolle, was die Beobachtung aus 
Abschnitt 12.3.4 bestätigen würde, aber weitere Forschung bleibt notwendig, um 
dieser Rolle auf den Grund zu gehen. 
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Abb. 47a: Effektplots der Regression zu den Artikulatoren (‚Sprecher‘ als ‚random effect‘) 
( = beschränkte Gestikulierfreiheit durch Handlung oder Objekt, N = frei zum Gestikulieren; ste- 
hend = Sprecher steht; sitzend = Sprecher sitzt) 
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Abb. 47b: Effektplots der Regression zu den Artikulatoren (‚Sprecher‘ nicht als ‚random effect‘) 
( = beschränkte Gestikulierfreiheit durch Handlung oder Objekt, N = frei zum Gestikulieren; ste- 
hend = Sprecher steht; sitzend = Sprecher sitzt) 
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Tab. 15b: Ergebnisse der Regression zu den Artikulatoren (‚Sprecher‘ nicht als ‚random effect‘) 


Estimate Std. Error z value Pr(>]z]) 
(Intercept) -2.1953 0.4551 -4.824 1.42e-06 *** 
BEWEGUNGSFREIHEIT 
frei > eingeschränkt 0.2058 0.3297 0.624 0.532 
HALTUNG 


stehend > sitzend 1.5431 0.3145 4.907 9.27e-07 *** 


Zum Schluss sei noch kurz auf die dritte Regressionsfrage eingegangen: Auf 
welcher Gestendimension sind die abtönungsliierten Gesten zu den Modalparti- 
keln anzusiedeln? Erneut ist für die Diskussion vor allem ein bestimmter Unter- 
schied relevant: Die abtönende Dimension ist nachweisbar oder nicht. Auch dies- 
mal sind nur die beiden relevantesten Faktoren in die Ergebnisse in Tabelle 16 
aufgenommen worden: Ist die Partikel kontextverschoben oder nicht und steht 
sie in einem Zitat oder nicht? Dabei ist letztere Frage als eine abgeschwächte Va- 
riante der ersteren zu verstehen: Alle Zitate sind kontextverschoben, aber das Ge- 
genteil trifft nicht zu. Wie aufgrund der Besprechung im Abschnitt 12.3.5 zu er- 
warten war, stellt sich heraus, dass kontextverschobene oder zitierte Partikeln 
weniger oft mit einer Geste einhergehen, in der die abtönende Dimension deut- 
lich nachzuweisen ist. Der allgemeinere Faktor ‚Kontextverschiebung‘ scheint al- 
lerdings etwas erklärungsstärker zu sein, sodass die Vermutung naheliegt, dass 
die Art der Kontextverschiebung (zitiert oder anders) für diese Frage keine große 
Rolle spielt: Wichtig ist vor allen Dingen, ob der aktuelle Sprecher selber die 
Quelle der Abtönung ist bzw. ob die Abtönung kontextverschoben ist, denn in 
letzterem Fall werden weniger abtönende Gesten eingesetzt, egal wie die Kon- 
textverschiebung zustande kommt. Allerdings zeigen die Effektplots in Abbil- 
dung 48, dass auch diese Tendenz nicht gerade als stark zu betrachten ist. 


Tab. 16: Ergebnisse der Regression zu den Gestendimensionen (‚Sprecher‘ als ‚random effect‘) 


Estimate Std. Error z value Pr(>]z]) 
(Intercept) 1.7721 0.4343 4.080 4.5e-05 *** 
ZITAT 
nicht zitiert > zitiert -0.5548 1.3183 -0.421 0.674 


KONTEXTVERSCHIEBUNG 
nein > ja -0.8657 1.0445 -0.829 0.407 
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Abb. 48: Effektplots der Regression zu den Gestendimensionen (‚Sprecher‘ als ‚random effect‘) 
(Zit = zitiert, n_Zit = nicht zitiert; KV = kontextverschoben, n_KV = nicht kontextverschoben) 


12.4 Fazit 


In diesem Kapitel wurde die Distribution der abtönungsliierten (und insbeson- 
dere der abtönenden) Gesten einer näheren Betrachtung unterzogen. Es hat sich 
herausgestellt, dass der Anteil der Belege einer Partikel, die mit einer abtönungs- 
liierten Geste kookkurrieren, durchaus mit der Stärke bzw. der Spezifizität der 
abtönenden Bedeutung dieser Partikel zu verknüpfen ist. Zudem hat sich gezeigt, 
dass die Uniformität innerhalb der Gesteninventare der einzelnen Partikeln so- 
wie zwischen diesen Inventaren durchaus ein Indiz für die Bedeutung der Parti- 
keln bzw. die Bedeutungsbeziehungen zwischen den Partikeln bilden können. So 
wurde abermals bestätigt, dass die Partikeln eben und halt nicht einfach als Sy- 
nonyme betrachtet werden können. 

Danach wurde die Distribution der Gesten mit den Unterschieden zwischen 
den Datentypen sowie mit anderen Faktoren in Beziehung gesetzt. Es hat sich 
herausgestellt, dass die Distributionskurven von abtönenden Gesten und bedeu- 
tungsähnlichen Partikeln nicht unbedingt parallel verlaufen, dass aber andere 
Faktoren durchaus einen größeren Einfluss auf die Distribution der Gesten ha- 
ben. Insbesondere auf die hohe Anzahl der Partikelbelege ohne abtönungsliierte 
Geste wurde durch diese Analyse ein neues Licht geworfen, da sich herausgestellt 
hat, dass sie sich wenigstens zum Teil durch andere Faktoren erklären lassen, 
zum Beispiel durch eine Beschränkung der Bewegungsfreiheit. 

Indessen mussten einige Fragen unbeantwortet bleiben. Die genaue Rolle 
der Körperhaltung des Sprechers bleibt zum Beispiel noch ein Forschungsdesi- 
derat. Ähnlich konnte in diesem Kapitel nur ein allgemeines, übergreifendes Bild 
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skizziert werden; es bleibt also noch zu untersuchen, inwiefern die nachgewiese- 
nen Tendenzen für alle Partikeln bzw. für alle Partikel-Geste-Kookkurrenzmuster 
gleichermaßen gelten. Des Weiteren konnte die Rolle des Grammatikalisierungs- 
grades der Gesten selber noch nicht ins Detail besprochen werden. Auf diese Ges- 
tengrammatikalisierung soll im nächsten Kapitel ausführlicher eingegangen 
werden. 


13 Die Grammatikalisierung abtönender Gesten 


13.0 Einführung 


Bei der Vorstellung einiger abtönender Gesten in den Kapiteln 7-9 wurde darauf 
hingewiesen, dass sich diese Gesten aus bestimmten emblematischen oder deik- 
tischen Gesten entwickelt haben dürften (abtönendes Kopfschütteln aus emble- 
matischem Kopfschütteln, abtönendes Nicken aus emblematischem Nicken, in- 
tersubjektives Deiktikum aus referentiellem Deiktikum usw.). Dabei wurde die 
Hypothese formuliert, dass es sich um eine Art Grammatikalisierung handeln 
dürfte. Auf diese Hypothese wird im Folgenden ausführlicher eingegangen. 

Die Idee, dass eine visuelle Ausdrucksform wie die Gestik Prozessen wie 
Grammatikalisierung unterliegt, dürfte auf den ersten Blick als seltsam erschei- 
nen. Zum Teil dürfte dies damit zu tun haben, dass sich die Linguistik bislang vor 
allem mit der verbalen Ausdrucksebene befasst hat, und dass mithin viele Be- 
griffe vor allem auf dieser Ebene definiert sind. Allerdings ist insbesondere im 
Rahmen der Gebärdensprachenforschung der Begriff der Grammatikalisierung 
schon auf die visuelle Ausdrucksebene erweitert worden (13.1). Im vorliegenden 
Kapitel wird der Frage nachgegangen, inwiefern die traditionellen Grammatika- 
lisierungsparameter sich auch auf die Entwicklung der Gestik anwenden lassen 
(13.2), und anhand dieser Besprechung soll im Anschluss (13.3) geklärt werden, 
ob es sich im Falle der besprochenen Gestikmuster um Grammatikalisierung han- 
delt oder nicht. 

Bevor zu der eigentlichen Argumentation übergegangen wird, sei allerdings 
noch eine wichtige methodologische Anmerkung geliefert. Während die Gestik- 
forschung an sich schon eine lange Tradition hat (vgl. u. a. Müller 1998), ist die 
Verwendung von Videodaten für die Gestikanalyse erst durch neuere technische 
Entwicklungen möglich geworden. Dementsprechend sind alle verfügbaren Vi- 
deomaterialien jüngeren Datums, und die für vorliegende Arbeit verwendeten 
Korpusdaten sind als rein synchron zu betrachten. Daraus folgt eine beachtliche 
Einschränkung der Möglichkeiten im Hinblick auf eine tiefgreifende diachrone 
Analyse. Allerdings erlauben die synchronen Daten durchaus Inferenzen über 
den Verlauf der Entwicklung. Trotzdem müssen diese Inferenzen, mangels dia- 
chroner Daten, zum Teil hypothetisch bleiben. Daher kann die Frage, ob es sich 
im Falle der analysierten Gesten um Grammatikalisierung handelt, keine endgül- 
tige Antwort bekommen, aber es ist durchaus möglich (wie auch im Folgenden 
gezeigt werden soll), einen ersten Ansatz zu liefern. 
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13.1 Visuelle Grammatikalisierung 


Die Annahme, dass sich auch in den visuellen Kommunikationsmodi Grammati- 
kalisierungsprozesse vorfinden lassen, dürfte auf den ersten Blick überraschend 
erscheinen. Bei näherem Hinsehen ist diese Annahme jedoch nicht so fremd: Aus 
der Gebärdensprachenforschung ist bereits bekannt, dass sich in Gebärdenspra- 
chen durchaus Grammatikalisierungsprozesse nachweisen lassen, die mit denen 
in gesprochenen Sprachen übereinstimmen (u. a. Pfau/Steinbach 2006, 2011). 
Ein typisches Beispiel ist die Entwicklung eines Bewegungsverbs zu einem Zu- 
kunftsmarkierer, ähnlich wie englisch be going to, niederländisch gaan oder fran- 
zösisch aller, die sich u. a. in der Amerikanischen Gebärdensprache nachweisen 
lässt (vgl. Janzen/Schaffer 2002). Die Zeichen, die in diesem Fall der Grammati- 
kalisierung unterliegen, sind also die direkten Pendants der verbalen Elemente, 
auf die die Grammatikalisierung auch in der gesprochenen Sprache einwirkt. In 
der Hinsicht ist es nicht allzu verwunderlich, dass hier Grammatikalisierung 
möglich ist. 

Was die visuellen Ausdrucksmodalitäten betrifft, wird der Begriff ‚Gramma- 
tikalisierung‘ allerdings auch auf einer anderen Ebene verwendet. Es wurde in 
der Literatur bereits nachgewiesen, dass Gesten (wie in der vorliegenden Arbeit 
definiert) in das System einer Gebärdensprache eingehen können. Wenn die 
dadurch entstehenden Zeichen im System der Gebärdensprache als grammati- 
sche Markierer funktionieren, wird diese Entwicklung als Grammatikalisierung 
bezeichnet (u. a. Pfau/Steinbach 2006, 2011, Wilcox 2004). Als Beispiele der 
Grammatikalisierung sind u. a. die Entwicklung von Zeigegesten zu Pronomina 
und die Entwicklung von Negationsgesten zu Negationsgebärden zu nennen 
(Pfau/Steinbach 2011). 

Die letztgenannten Beispiele sind als Fälle der Grammatikalisierung von Ges- 
tik zu betrachten. Allerdings gehen die Gesten damit auch in die Domäne der Ge- 
bärden ein. In der folgenden Diskussion sollen jedoch Entwicklungen innerhalb 
der Gestikdomäne fokussiert werden. Die Frage ist also, ob die Entwicklungen in 
dieser Domäne auch als Beispiele von dem zu betrachten sind, was auf verbaler 
Ebene als ‚Grammatikalisierung‘ bezeichnet wird.! 


1 Diese Formulierung (‚was auf verbaler Ebene als Grammatikalisierung bezeichnet wird‘) ist 
nicht unwichtig, da auch auf verbaler Ebene noch Diskussion über die genaue Reichweite des 
Begriffs ‚Grammatikalisierung‘ besteht (vgl. dazu Abschnitt 13.3). 
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13.2 Grammatikalisierungsparameter 


13.2.0 Einführung 


Um zu bestimmen, ob es sich bei den oben aufgelisteten Entwicklungen um 
Grammatikalisierung handelt, wird der Frage nachgegangen, inwiefern sich die 
traditionellen Grammatikalisierungsparameter darauf anwenden lassen. Das ist 
die Absicht dieses Abschnitts. 

Ein zentraler Aspekt der traditionellen Definitionen des Grammatikalisie- 
rungsbegriffs (u. a. Meillet 1912, Kuryłowicz 1965) ist, dass das der Grammatikali- 
sierung unterliegende Element eine grammatischere Natur bekommt. Inwiefern 
dies auf die in der vorliegenden Arbeit analysierten Gesten zutrifft, ist nicht ohne 
Weiteres klar. Der Grund ist, dass sich die relevanten Gesten in der Domäne der 
Abtönung ansiedeln lassen. Auf die verbalen Modalpartikeln hinweisend gibt 
Diewald (1997) an, dass ihre abtönende Funktion als eine grammatische zu be- 
trachten ist, während Molnär (2008) behauptet, es handle sich nicht um gram- 
matische, sondern um pragmatische Elemente, und dementsprechend sei eine 
Analyse im Rahmen der Grammatikalisierungstheorie zu verwerfen. 

Um bestimmen zu können, ob es sich bei den abtönenden Gesten um gram- 
matische Elemente handelt, müsste also zunächst geklärt werden, ob Abtönung 
als eine grammatische Funktion zu sehen ist oder nicht. Dies umfasst notwendi- 
gerweise auch eine Auseinandersetzung mit der grundlegenderen Frage, ob und 
wie Gesten in gesprochenen Sprachen wie dem Deutschen grammatische Funk- 
tionen erfüllen können. Diese Diskussion wäre jedoch ein Buch für sich. 

Wie dem auch sei, neuere Entwicklungen in der Grammatikalisierungsfor- 
schung haben gezeigt, dass der Erwerb einer grammatischeren Natur nicht die 
einzige relevante Entwicklung bei Grammatikalisierungsprozessen ist. Forscher 
wie Hopper (1991) und Lehmann (1995) haben eine Liste von für Grammatikali- 
sierung typischen Merkmalen und Parametern aufgestellt. Im Folgenden soll der 
Frage nachgegangen werden, inwiefern sich diese auf die Entwicklung von Ges- 
ten anwenden lassen. 


13.2.1 Form- und Bedeutungsbezogene Parameter 


Eines der typischen Merkmale der Grammatikalisierung ist die formale Erosion. 
Im Rahmen der Besprechung der einzelnen Gestikmuster in den Kapiteln 8-10 
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wurden einige Annahmen diesbezüglich formuliert. In Kapitel 8 wurde zum Bei- 
spiel dargelegt, dass das intersubjektive Deiktikum im Gegensatz zum referenti- 
ellen Deiktikum häufiger mit der Schüsselhand als mit der flachen Hand realisiert 
wird. Die Schüsselhand ist eine gelockerte, entspanntere und weniger Muskelto- 
nus verlangende Variante der flachen Hand (vgl. auch die Bezeichnung als „lax 
flat hand“ bei Bressem 2008). Die Entwicklung von der starreren flachen Hand 
(referentielles Deiktikum) zur lockereren Schüsselhand (intersubjektives Deikti- 
kum) dürfte also als eine Art Abschwächung bzw. als eine Form der Erosion zu 
betrachten sein. Ähnlich dürfte bei den Kopfgesten eine gewisse Erosion nachzu- 
weisen sein, in dem Sinne, dass sie in der abtönenden Verwendung vielfach eher 
subtil sind (vgl. Kapitel 7) und eine beschränktere Amplitude aufzuweisen schei- 
nen als in der emblematischen Verwendung. Es bleibt jedoch weiter zu verifizie- 
ren, wie systematisch diese Tendenz ist.’ Das eng mit Erosion verwandte Merkmal 
der Koaleszenz (Zunahme der Fügungsenge, d. h. Entwicklung von einem freien 
zu einem gebundenen Morphem) ist noch schwieriger auf die visuellen Kommu- 
nikationsmodi anzuwenden: In Gebärdensprachen lässt sich kaum Koaleszenz 
nachweisen (Pfau/Steinbach 2011: 689), und für Gestik scheint sie mindestens 
genauso schwierig zu beschreiben zu sein, zumal sich die Frage stellt, an was 
sich das gebundene Gestenmorphem anhängen soll (an ein bestimmtes verbales 
Element?). Daher soll an dieser Stelle nicht weiter darauf eingegangen werden. 
Auf der Bedeutungsseite lässt sich ebenfalls eine gewisse Abschwächung 
nachweisen, unter der Form von Bedeutungsverblassung bzw. Desemantisie- 
rung. Diese Bedeutungsverblassung ist eine der Facetten der Triade der Bedeu- 
tungsentwicklung bei Grammatikalisierung, zusammen mit Bedeutungspersis- 
tenz und Bedeutungserweiterung (bzw. -Bereicherung). Gemeint ist damit, dass 
die Bedeutung der grammatikalisierenden Elemente einer Tendenz zur Verblas- 
sung unterliegt, der allerdings durch die Tendenz zur Persistenz entgegengewirkt 
wird. Zugleich kann die Verblassung Raum für eine neue Bedeutungserweiterung 
schaffen, sodass neue Elemente in die Bedeutung der Form eingehen können. 


2 Auch wenn sich diese Tendenz bestätigen sollte, zeigt das allerdings noch nicht, dass die ab- 
tönende Verwendung eine erodierte Variante der emblematischen Verwendung ist. Theoretisch 
könnte sich die Amplitude der letzteren auch vergrößert haben. Mangels diachronischer Daten 
kann diese Frage nicht endgültig beantwortet werden, aber im Hinblick auf den allgemeinen 
Ablauf der Entwicklung von Sprache dürfte die Erosionsanalyse die plausiblere sein. 

Auch Faktoren wie Geschwindigkeit und Iteration dürften sich mit Erosion verknüpfen lassen. 
Allerdings wäre in ersterem Fall noch zu klären, ob stärkere Erosion mit langsamerer (d. h. we- 
niger energischer) oder schnellerer (d. h. kürzerer) Bewegung zu verknüpfen wäre; im Falle der 
Iteration ginge Erosion mit Reduktion der Iteration einher. Auch für diese Parameter bleibt je- 
doch weitere Erforschung notwendig. 
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Diese drei Tendenzen lassen sich bei den analysierten Gesten unterscheiden. 
Das Kopfschütteln zum Beispiel ist nicht mehr rein negierend (Verblassung), ob- 
wohl in Kapitel 7 darauf hingewiesen wurde, dass implizit noch ein Hauch der 
Negation nachweisbar ist (Persistenz). Zugleich war die pragmatisch-abtönende 
Nuance der subjektiven Evidenz im emblematisch-negierenden Kopfschütteln 
noch nicht so deutlich anwesend wie im abtönenden Kopfschütteln (Erweite- 
rung). Ähnlich ist die intersubjektive Zeigegeste nicht mehr rein referentiell, ob- 
wohl sie immer noch eine referentielle Komponente enthält (sie identifiziert die 
Person, mit der Übereinstimmung gesucht wird). Dafür hat auch diese Geste eine 
abtönende Bedeutung (Einverständnismarkierung) hinzugewonnen. 

In engem Zusammenhang mit der Bedeutung einer Form steht ihr Skopus. 
Typisch für Grammatikalisierung ist Kondensierung, d. h. Skopusverengung. Al- 
lerdings gehören die in vorliegender Arbeit analysierten Gesten der Domäne der 
Abtönung an. Ein typisches Merkmal abtönender Elemente ist ihr breiter Skopus: 
Sie haben Skopus über die ganze Äußerungseinheit oder gar die ganze Äuße- 
rung, mit der sie vorkommen. Wie in den Fallstudien bereits angedeutet wurde, 
gilt dies sowohl für verbale als auch für gestische Abtönungsmittel. Es stellt sich 
zwar die Frage, ob bei der Analyse der Gesten von Skopus über die verbale Äuße- 
rung oder über andere Gesten auszugehen ist, aber da Abtönung sowieso einen 
breiten Skopus impliziert, kann es keine Skopusreduzierung gegeben haben, un- 
geachtet, wie man den Skopusbegriff definiert. Zu erwähnen ist jedoch Nordes 
(2012: 105) Beobachtung, dass „the parameter of scope is of little use, because 
there does not appear to be a preferred direction in scope change in either gram- 
maticalization or degrammaticalization.“ Damit scheidet die fehlende Skopus- 
verengung als Argument gegen eine Einstufung der relevanten Gestikentwick- 
lungen als Grammatikalisierung ohnehin aus. 

Zum Abschluss dieser ersten Reihe von Grammatikalisierungsparametern sei 
noch auf den für Grammatikalisierung typischen Kategorienwechsel eingegan- 
gen. Mit den bedeutungsbezogenen und formalen Entwicklungen im Laufe des 
Grammatikalisierungsprozesses geht auch ein Kategorienwechsel der der Gram- 
matikalisierung unterliegenden Elemente einher, der sich in einem Verlust der 
typischen Merkmale der ursprünglichen Kategorie zeigt. Typischerweise handelt 
es sich vor allem um morphosyntaktische Merkmale wie abnehmende Flektier- 
barkeit und ein verändertes Stellungsverhalten, die nicht direkt in die Gestikdo- 
mäne übertragen werden können. Außerdem spielen solche Merkmale für die De- 
finition der in der Gestenforschung herkömmlicherweise angewandten Katego- 
rien eine geringere Rolle. McNeills Gestendimensionen etwa sind aus einer eher 
semiotischen Perspektive heraus definiert worden und beziehen sich auf die Na- 
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tur der Beziehung der Geste zu ihrem Referenten bzw. zu ihrer Bedeutung (iko- 
nisch, metaphorisch, deiktisch...). In der Analyse der verbalen Ebene wird dage- 
gen vor allem von Wortarten ausgegangen wird, die zum Teil morphosyntaktisch 
definiert sind, zum Teil aufgrund der Art der Bedeutung bzw. des Referenten (Ob- 
jekt für Nomina, Handlung für Verben, Beziehung für Präpositionen und Kon- 
junktionen...), aber nicht aufgrund der semiotischen Beziehung zwischen Form 
und Bedeutung. 

Trotzdem kann man sagen, dass sich die Eigenschaften der Gesten verändert 
haben. Zum Beispiel handelt es sich, aufgrund der Bedeutungsentwicklung, im 
Falle der Kopfgesten nicht mehr um autosemantsche Formen (explizit bejahend 
bzw. verneinend), sondern wie andere abtönende Elemente gehören sie zu den 
Synsemantika. Des Weiteren können diese Gesten nicht mehr isoliert verwendet 
werden: Während es möglich ist, eine Entscheidungsfrage nur mit einem Nicken 
oder Kopfschütteln ohne verbale Äußerung zu betrachten, können die Gesten in 
abtönender Verwendung nur in Kombination mit Verbalem eingesetzt werden 
(was auch als eine Form der Koaleszenz betrachtet werden könnte). Die für die 
Grammatikalisierung typischen Prozesse führen also zu einer Veränderung der 
Eigenschaften und Gebrauchsbedingungen der Form, wie sie herkömmlicher- 
weise als Dekategorisierung bezeichnet wird. In der Hinsicht lässt sich also fest- 
halten, dass wir es hier mit einer Art Dekategorisierung zu tun haben, selbst wenn 
nicht mit Kategorien wie Wortarten gearbeitet wird, die traditionell für diese 
Frage herangezogen werden. 


13.2.2 Frequenzbezogene Entwicklungen 


Mit den bislang beschriebenen Entwicklungen geht in Grammatikalisierungspro- 
zessen typischerweise eine Ausweitung der Verwendung der Form einher: Die 
Form wird häufiger und in mehr unterschiedlichen Kontexten verwendet. Letz- 
tere Entwicklung, die gelegentlich als ‚Expansion‘ bezeichnet wird, lässt sich 
auch für die an dieser Stelle relevanten Gesten nachweisen. Das Kopfschütteln 
wird zum Beispiel heutzutage auch in Kontexten verwendet, in denen nichts ne- 
giert wird (vgl. Kapitel 7), und das intersubjektive Deiktikum wird auch in Kon- 
texten eingesetzt, die kein Pronomen in der zweiten Person enthalten, dessen Re- 
ferent zu identifizieren wäre. Ob die Frequenz der Gesten auch tatsächlich zuge- 
nommen hat, ist anhand von rein synchronen Daten kaum zu sagen, aber auf- 
grund der gerade erwähnten Expansion liegt die Vermutung nahe, dass tatsäch- 
lich eine Frequenzzunahme stattgefunden hat. 
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Allerdings ist die Fregquenzzunahme bei Grammatikalisierung nicht nur auf 
Expansion zurückzuführen. Ein weiterer Grund ist die sogenannte Divergenz, 
d.h. das Weiterbestehen der ursprünglichen Verwendung der Form neben der 
neuen. Das Vorkommen dieses Phänomens bei den analysierten Gesten lässt sich 
nicht leugnen: Das explizit negierende Kopfschütteln, das explizit bestätigende 
Nicken und die referentielle Zeigegeste werden bis heute verwendet. 

In einem Atem mit Divergenz wird vielfach auch Schichtung (‚layering‘) er- 
wähnt. Gemeint ist damit, dass den Sprechern einer Sprache unterschiedliche 
Mittel zur Vermittlung von Bedeutungen in einer bestimmten funktionalen Do- 
mäne zur Verfügung stehen, da neuere Entwicklungen nicht unbedingt zum Ver- 
schwinden älterer Formen in der Domäne führen. Ob die Gesten Schichtung auf- 
weisen, ist allerdings nicht so eindeutig zu sagen. Tatsächlich lassen sich 
Schichtungsphänomene in der Gestik nur schwer nachweisen. Wenn man aller- 
dings die Sprache als Ganzes betrachtet und allein diesem multimodalen Sprach- 
kode integrierten Ausdrucksebenen in Betracht zieht, ist die Schichtung deutli- 
cher nachweisbar: Die abtönenden Nuancen, die durch die Gesten zum Ausdruck 
gebracht werden, können auch etwa durch verbale Elemente vermittelt werden, 
darunter die Modalpartikeln, die den Ausgangspunkt für die vorliegende Analyse 
bilden. Es gilt allerdings noch zu klären, ob für das Studium von Grammatikali- 
sierung auf einer semiotischen Ebene eine solche Ausweitung über den Mat- 
rixkode ‚Sprache‘ als Ganzes opportun ist. 


13.2.3 Weitere Aspekte der Grammatikalisierung 


Ein ähnliches Bild zeigt sich für Fixierung, d. h. für den Verlust an syntaktischer 
Mobilität. Tatsächlich ist zu klären, was dieser Begriff für Gestik beinhaltet: Be- 
trachtet man Fixierung in Bezug auf andere Gesten oder in Bezug auf die verbale 
Ausdrucksebene? Fixierung in Bezug auf andere Gesten dürfte jedoch an dieser 
Stelle schwer zu bestimmen sein. Was die Fixierung in Bezug auf die verbale 
Ebene betrifft, lassen sich durchaus einige Tendenzen nachweisen, die sich mit 
McNeills (1992) Synchronieregeln verknüpfen lassen: Die Gesten tendieren dazu, 
mit dem Hauptton der abgetönten Äußerung sowie mit dem lexikalischen Partner 
(in vorliegender Arbeit typischerweise die Modalpartikel) zu überlappen, wenn 
es einen gibt. Zudem wird das Timing der Gesten durch ihren Skopus auf verbaler 
Ebene beeinflusst. Allerdings handelt es sich um Tendenzen, die für Gestik im 
Allgemeinen gelten; sie trafen somit auch schon vor Anfang des Grammatikali- 
sierungsprozesses zu. Es ist nicht auszuschließen, dass diese Tendenzen im 
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Laufe der Grammatikalisierung stärker geworden sind, aber weitere Erforschung 
dieser Frage bleibt notwendig. 

Ähnlich unklar ist die Situation für die eng verwandten Parameter der Spezi- 
alisierung und Obligatorisierung, d. h. die Tendenzen, dass sich das der Gram- 
matikalisierung unterliegende Element gegenüber Konkurrenten in der gleichen 
funktionalen Domäne durchsetzt und sich zudem von einem frei wählbaren zu 
einem obligatorisch zu setzenden Element entwickelt. Auf dieser Ebene zeigen 
die Daten keine deutlichen Tendenzen in Bezug auf die analysierten Gesten. 
Höchstens ließe sich erneut auf die verbale Ebene Bezug nehmen, in dem Sinne, 
dass die Tendenz zur Kookkurrenz? mit der verbalen Partikel wenigstens in eini- 
gen Fällen durchaus beachtlich ist. Weitere deutliche Tendenzen lassen sich aber 
bislang nicht nachweisen. 

Ebenso problematisch ist der letzte zu besprechende Parameter: Paradigma- 
tisierung. Allerdings bezieht sich die Schwierigkeit diesmal nicht auf die Bezugs- 
ebene (verbal oder gestisch), sondern vielmehr darauf, wie der Begriff ‚Para- 
digma‘ definiert werden soll und mit welcher Kategorie man es zu tun hat. Was 
letztere Frage betrifft, scheint ‚abtönende Gesten‘ ein guter Kandidat zu sein (ge- 
meint ist hier also die Sammlung der Gesten, die eindeutig eine abtönende Di- 
mension enthalten; dass auch andere Dimensionen in diesen Gesten vertreten 
sein dürften, ist an dieser Stelle von geringerer Wichtigkeit). Wenn man die von 
Brünjes (2014: 40) vorgeschlagene Definition des Begriffs ‚Paradigma‘ anwendet, 
zeigt sich, dass die Kategorie der abtönenden Gesten zwar Eigenschaften eines 
Paradigmas aufweist, aber trotzdem nicht als richtiges Paradigma betrachtet wer- 
den kann. Brünjes schlägt vor, von einem Paradigma zu sprechen, wenn die fol- 
genden Bedingungen erfüllt sind: 


Die Paradigmenmitglieder bilden eine geschlossene Klasse mit einer gemeinsamen gram- 
matischen Funktion und bestimmten formalen Gemeinsamkeiten. Die unterschiedlichen 
Werte sind Spezifizierungen der gemeinsamen Funktion, stehen systematisch in Opposi- 
tion zueinander, sind (meist) in Subkategorien organisiert und um einen unmarkierten 
Wert zentriert. Die Realisierung des Paradigmas ist obligatorisch. 


Einige dieser Merkmale treffen auf die Gruppe der abtönenden Gesten zu: Die Mit- 
glieder der Kategorie (d. h. die betroffenen Gesten) stehen in Oppositionsverhält- 
nissen zueinander, während die Funktionen der einzelnen Gesten als Spezifizie- 
rungen der allgemeinen Paradigmafunktion (in diesem Fall: Abtönung) zu 


3 Wie aus den einzelnen Fallstudien klar geworden sein dürfte, impliziert der Begriff ‚Kookkur- 
renz‘ nicht unbedingt zeitgleiche Realisierung bzw. temporale Überlappung. Die oben angedeu- 
teten Fixierungstendenzen folgen also nicht aus dieser potenziellen Obligatorisierung. 


252 —— Die Grammatikalisierung abtönender Gesten 


betrachten sind. Auf die Frage, ob es sich um grammatische Elemente handelt, 
wurde im Abschnitt 13.2.0 bereits eingegangen; ähnlich wie Diewald geht Brünjes 
davon aus, dass Abtönungselemente durchaus als grammatisch zu betrachten 
sind, sodass auch dieses Kriterium zutrifft.* 

Andere Elemente aus der von Brünjes vorgeschlagenen Definition sind im 
Falle der abtönenden Gesten nicht so deutlich nachzuweisen. Inwiefern es sich 
um eine geschlossene Klasse handelt und inwiefern sich die Gesten Formmerk- 
male teilen, bleibt zum Beispiel noch zu klären. Ähnlich wurde oben bereits 
nachgewiesen, dass bei den abtönenden Gesten bislang nicht von einer obligato- 
rischen Realisierung die Rede sein kann. Aus diesen Gründen kann nicht davon 
ausgegangen werden, dass es sich bei den abtönenden Gesten um ein richtiges 
Paradigma handelt. 


13.3 Gestikgrammatikalisierung? 


Aus der vorangehenden Diskussion ist hervorgegangen, dass die Antwort auf 
Frage, ob auch bei Gestik von Grammatikalisierung ausgegangen werden kann, 
nicht auf der Hand liegt. Wie die zusammenfassende Übersicht in Tabelle 17 zeigt, 
sind bei den relevanten Entwicklungen die wichtigsten Merkmale von Gramma- 
tikalisierung nachzuweisen, während das bei anderen Merkmalen nicht (bzw. 
nicht so deutlich) der Fall ist. Daher wird in der Tabelle auch ein Vergleich mit 
einem anderen nicht-prototypischen Fall von Grammatikalisierung gemacht. Da 
die analysierten Gesten alle in der Domäne der Abtönung anzusiedeln sind, wur- 
den zum Vergleich die verbalen Abtönungsmittel par excellence des Deutschen 
(die zudem den Ausgangspunkt der Analyse in vorliegender Arbeit bilden) her- 
angezogen: die Modalpartikeln. 

Tabelle 17 enthält eine Übersicht des Zutreffens der oben angesprochenen 
Merkmale der Grammatikalisierung auf die Entwicklung von Modalpartikeln und 
abtönenden Gesten. Zu beachten ist, dass Koaleszenz aus den oben (Abschnitt 
13.2.1) angesprochenen Gründen ausgelassen wurde. Zudem sei angemerkt, dass 


4 Es sei angemerkt, dass Brünjes im Grunde genommen den Begriff ‚grammatisches Paradigma‘ 
definiert, was voraussetzt, dass die Mitgliederelemente grammatischer Natur sind. Wenn man 
allerdings Abtönungselemente als pragmatische (und nicht als grammatische) Elemente be- 
trachtet, ließe sich die Frage stellen, ob von einem pragmatischen Paradigma ausgegangen wer- 
den könnte (das von einem grammatischen Paradigma nur in der Hinsicht verschieden wäre, 
dass die Elemente eine pragmatische statt einer grammatischen Funktion aufweisen). Darauf 
weiter einzugehen ist jedoch im Rahmen der vorliegenden Arbeit nicht möglich. 
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die Tabelle ein etwas vereinfachtes Bild liefert, da nicht alle Parameter gleicher- 
maßen auf die Entwicklung aller Gesten bzw. aller Partikeln zutreffen; die Werte 
in der Tabelle stellen eine Art „Durchschnitt“ dar. 


Tab. 17: Merkmale der Grammatikalisierung bei Gesten und Modalpartikeln? 


Gesten Partikeln 
grammatische Elemente +/- +/- 
Erosion + + 
(Fixierung ? +/-) 
Dekategorisierung + + 
Bedeutungsverblassung + + 
Persistenz + + 
Bedeutungserweiterung + + 
Kondensierung 
Obligatorisierung 
Paradigmatisierung +/- +(/-) 
Divergenz + + 
Schichtung + + 
Frequenzzunahme + + 
Expansion + + 


Wie aus den Angaben in der Tabelle hervorgeht, sind deutliche Übereinstim- 
mungen zwischen der Entwicklung abtönender Gesten und jener der Modalpar- 
tikeln nachzuweisen. Ausnahmen stellen nur die Fixierung und die Paradigma- 
tisierung dar. Allerdings wurde oben angedeutet, dass Fixierung bislang nur vis- 
à-vis der verbalen Ausdrucksebene definiert werden konnte. Wenn man Sprache 
als Ganzes (d. h. Verbales und Gestisches) berücksichtigt, ist dies nicht weiter 
problematisch, aber oben wurde bereits darauf hingewiesen, dass noch zu klären 
bleibt, inwiefern eine solche Ausweitung bei der Analyse von Grammatikalisie- 
rung wünschenswert ist. Dies erklärt zugleich auch, warum Fixierung in der Ta- 
belle eingeklammert ist.° 


5 Die Angaben zu den Modalpartikeln basieren auf früheren Arbeiten zur Partikelgrammatika- 
lisierung, insbesondere Abraham (1991), Autenrieth (2002, 2005) und Diewald (1997). 

6 Auch für Obligatorisierung und Schichtung wurden in der vorangehenden Besprechung nur 
klare Beispiele in Bezug auf die verbale Ebene geliefert. Allerdings wurden diese Parameter (im 
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Die andere Ausnahme ist die Paradigmatisierung. Brünjes (2014) hat gezeigt, 
dass die Modalpartikeln ebenfalls kein starkes Paradigma bilden. Allerdings folgt 
auch aus ihrer Analyse, dass die Gruppe der Modalpartikeln immerhin einem ty- 
pischen Paradigma ähnlicher sieht als jene der abtönenden Gesten. Dies ist ins- 
besondere auf ein bestimmtes Merkmal der Definition von ‚Paradigma‘ zurück- 
zuführen: Die verbalen Modalpartikeln weisen eine größere Formähnlichkeit auf, 
d. h. sie teilen eine beachtliche Anzahl formaler Merkmale. Jedoch scheint dieser 
Unterschied auf die unterschiedlichen Eigenschaften der semiotischen Kanäle 
(Verbales und Gestisches) zurückzuführen zu sein: Verbale Elemente dürften 
sich stärker ähneln als Gesten, die mit unterschiedlichen Artikulatoren realisiert 
werden. Daher liegt die Vermutung nahe, dass auch in diesem Fall der Unter- 
schied zwischen den beiden Entwicklungen (Grammatikalisierung von Gesten 
und Partikeln) nicht überschätzt werden sollte. 

Es stellt sich also heraus, dass die Entwicklung von Modalpartikeln und ab- 
tönenden Gesten beachtliche Übereinstimmungen aufweist, während die Unter- 
schiede hauptsächlich auf Unterschiede zurückzuführen sind, die den verschie- 
denen semiotischen Ausdrucksebenen (verbal vs. gestisch) inhärent sind. Aus 
diesem Grund scheint es gerechtfertigt, sich bei der Entscheidung, ob es sich im 
Falle der Entwicklung der Gesten um Grammatikalisierung handelt, an dem Ur- 
teil bezüglich der Entwicklung der Modalpartikeln zu orientieren. Allerdings be- 
steht bislang kein Einverständnis darüber, ob es sich bei der Entwicklung von 
Modalpartikeln um einen Fall von Grammatikalisierung handelt. Wie die Anga- 
ben in Tabelle 17 zeigen, treffen nicht alle Grammatikalisierungsparameter auf 
die Entwicklung von Modalpartikeln zu. Daher lehnen Forscher wie Molnär 
(2008) die Einstufung dieser Entwicklung als Grammatikalisierung ab und plä- 
dieren dafür, sie als Beispiel von Pragmatikalisierung betrachten. Allerdings sind 
die Übereinstimmungen zwischen Grammatikalisierung und Pragmatikalisie- 
rung beachtlich, sodass sich mit Forschern wie Traugott (2007: 151-152) und 
Brünjes (2014: 29) die Frage stellen lässt, ob man überhaupt von Pragmatikalisie- 
rung als gesondertem Sprachwandelprozess neben Grammatikalisierung ausge- 
hen soll. Wie Degand/Evers-Vermeul (2015) angeben, liegt der Unterschied viel- 
mehr im linguistischen Status des Ergebnisses (pragmatisch oder grammatisch) 
als im Prozess selber, und gerade die Linie zwischen Grammatik und Pragmatik 


Gegensatz zur Fixierung) nicht nur vis-à-vis der verbalen Ebene definiert, sondern es wurde auch 
auf die Möglichkeit deren Vorkommens auf der rein gestischen Ebene hingewiesen, was erklärt, 
warum diese Parameter in der Tabelle nicht eingeklammert sind. 
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ist nicht immer leicht zu ziehen (vgl. die Diskussionen, ob Modalpartikeln gram- 
matische Elemente sind oder nicht und wie eng oder weit man den Grammatik- 
begriff fassen sollte - ausführlicher dazu auch Auer/Günthner 2003).’ 

Unabhängig davon, wie diese Frage beantwortet wird, sind aber die meisten 
Forscher der Meinung, dass man aufgrund der Übereinstimmungen mit typi- 
schen Grammatikalisierungsprozessen die Entwicklung von Modalpartikeln im- 
merhin als einen Fall von Grammatikalisierung betrachten könne, wenngleich 
als einen unprototypischen: 


The grammaticalization of MPs [= modal particles] may thus be a highly specific type, which 
may not be found to agree in every respect with other types of grammaticalization. (Abra- 
ham 1991: 375) 


Though it is not obvious that grammaticalization theory is an adequate framework for 
modal particles, it can be shown that a wider notion of grammaticalization, as proposed for 
example by Hopper (1991), is appropriate and profitable for the description of their histori- 
cal development. (Autenrieth 2005: 305) 


Wenn die Entwicklung von Modalpartikeln als Grammatikalisierung betrachtet 
wird und wenn die Entwicklung der abtönenden Gesten jener der Modalpartikeln 
dermaßen stark ähnelt, erscheint es m. E. gerechtfertigt, auch die Entwicklung 
der abtönenden Gesten als einen Fall von Grammatikalisierung einzustufen. 


13.4 Fazit 


In diesem Kapitel wurde die Frage gestellt, ob es innerhalb der Gestikdomäne 
Entwicklungen gibt, die als Grammatikalisierung betrachtet werden können. An- 
hand der Methode der synchronen Grammatikalisierungsforschung wurden ab- 
tönende Gesten mit den Gestikmustern verglichen, aus denen sie sich entwickelt 
haben, und es wurde der Frage nachgegangen, inwiefern sich die Unterschiede 
zwischen den beiden Entwicklungsstufen mit den traditionellen Grammatikali- 
sierungsparametern verknüpfen lassen. Es hat sich herausgestellt, dass diese Pa- 
rameter - sofern sie sich überhaupt auf die Gestikdomäne übertragen lassen - 


7 Heine (2013) zufolge liege der Pragmatikalisierung eine Form von Kooptierung (‚cooptation‘) 
zugrunde, sodass dieser Prozess eindeutig von jenem der Grammatikalisierung zu unterschei- 
den sei. Nach dieser Auffassung kann die Entwicklung von Abtönungselementen nur schwer als 
Pragmatikalisierung bezeichnet werden, da mehrere der von Heine als für Kooptierung typische 
Merkmale nicht nachweisbar sind (insbesondere die Spontaneität der Entwicklung, das Fehlen 
einer externen Dekategorisierung und die Zunahme der topologischen Freiheit). 


256 —— Die Grammatikalisierung abtönender Gesten 


weitgehend auf die relevanten Entwicklungen zutreffen. In der Hinsicht scheint 
es gerechtfertigt, von Grammatikalisierung zu sprechen. 

Dass sich abtönende Gesten mit Grammatikalisierung verknüpfen lassen, ist 
wenigstens von der Bedeutung her auch nicht verwunderlich, da auch auf verba- 
ler Ebene Abtönungsmittel häufiger durch Grammatikalisierung entstanden sind 
(darunter auch die Modalpartikeln, vgl. Abschnitt 13.3). Ebenso wenig soll es 
Wunder tragen, dass die Quellformen der besprochenen Entwicklungen Emb- 
leme oder Zeigegesten sind. Tatsächlich wurde in Kapitel 3 bereits gezeigt, dass 
diese beiden Gestentypen stärker konventionalisiert sind und für die Interpreta- 
tion weniger von der begleitenden verbalen Äußerung abhängig sind als die 
durchschnittliche ikonische oder metaphorische Geste. Letztere Gestentypen 
sind deutlich idiosynkratischer, was sie als Ausgangspunkt für einen Prozess wie 
Grammatikalisierung weniger wahrscheinlich macht. Tatsächlich sind auch auf 
verbaler Ebene die Quellformen von Grammatikalisierungsprozessen meist allge- 
mein gängige, d. h. mit beachtlicher Häufigkeit verwendete und nicht idiosynkra- 
tische Strukturen. Die Annahme scheint also gerechtfertigt, dass diese Restrik- 
tion auch für Gestikgrammatikalisierung gilt: Die Gesten, die für Grammatikali- 
sierung in Frage kommen, sind die weniger idiosynkratischen. 

Zum Schluss sei allerdings nochmals daran erinnert, dass die in diesem Ka- 
pitel gebotenen Darlegungen zum Teil hypothetisch sind. Dafür sind insbeson- 
dere zwei bereits angesprochene Gründe zu nennen: Zum einen basiert die Ana- 
lyse nur auf synchronen Daten, und zum anderen bleibt für einige Parameter 
weiterhin zu klären, ob bei der Analyse der Entwicklung der Gestik auch die 
kookkurrente verbale Ausdrucksebene in Betracht gezogen werden soll oder ob 
man sich auf die gestische Ebene beschränken sollte. Trotzdem suggeriert die vo- 
rangehende Argumentation, dass die These, es handle sich bei der Entwicklung 
der abtönenden Gestik um einen Fall von Grammatikalisierung, einen interessan- 
ten und wertvollen Ansatz für die weitere Gestikforschung darstellt. 


14 Abtönungsformen als multimodale 
Konstruktionen? 


14.0 Einführung 


Im vierten Kapitel wurde bereits eine Einführung in die Konstruktionsgrammatik 
geliefert. Dabei wurde im Abschnitt 4.3 auf die Frage eingegangen, wie es mit ei- 
ner multimodalen Anreicherung der Konstruktionsgrammatik aussieht. In dieser 
Diskussion wurden einige Argumente für eine Erweiterung des Konstruktionsbe- 
griffs auf multimodale Größen geliefert. Trotzdem konnte die Frage nach der 
Stelle der Multimodalität in der Konstruktionsgrammatik noch nicht endgültig 
geklärt werden und dementsprechend bleibt noch zu bestimmen, inwiefern es 
sich bei den Partikel-Geste-Kookkurrenzmustern um Konstruktionen handelt. 

Infolge der Stärke scheinen einige der besprochenen Kookkurrenzmuster 
(u. a. einfach+Kopfschütteln) durchaus eine gewisse Affinität zu Konstruktionen 
aufzuweisen. Trotzdem hat die Analyse auch einige Schwierigkeiten aufgedeckt, 
die es zu bewältigen gilt, bevor von einer richtigen multimodalen Konstruktion 
ausgegangen werden kann (u. a. die Diskrepanz in der Zeitdauer zwischen der 
Partikel und der Geste). Auf diese Schwierigkeiten wird im Abschnitt 14.3 aus- 
führlicher eingegangen. Zuvor scheint es jedoch sinnvoll, zu klären, wie der mul- 
timodale Konstruktionsbegriff genau zu konzipieren ist bzw. welche Stelle die 
multimodalen Größen in der Konstruktion einnehmen (14.1) und wie die Be- 
schreibung solcher multimodalen Partikelkonstruktionen aussehen könnte 
(14.2). 


14.1 Zu einem multimodalen Konstruktionsbegriff 


Um den Übergang von einer monomodalen, rein verbal orientierten Konstrukti- 
onsgrammatik zu einer multimodalen Konstruktionsgrammatik zu machen, ist 
zunächst zu bestimmen, wie der Beitrag der multimodalen Größen zur Konstruk- 
tion zu sehen ist. Im Grunde genommen sind mehrere Grade der Integration mul- 
timodaler Größen in eine Konstruktion zu unterscheiden. Diese sollen im Folgen- 
den eingehender besprochen werden, von der klassischen monomodalen Kon- 
struktion (ohne Integration von Multimodalem) bis hin zur multimodalen Kon- 
struktion im wahrsten Sinne des Wortes, d. h. mit vollständiger Integration. 
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14.1.1 Monomodale Konstruktion 


Am Anfang dieser Übersicht erscheint es sinnvoll, kurz zu wiederholen, wie der 
Konstruktionsbegriff zu Anfang der Arbeit (monomodal) definiert wurde. Im Ab- 
schnitt 4.1.1 wurde auf nachstehende Abbildung aus Deppermann (2006a) ver- 
wiesen: 


syntaktische Eigenschaften 
morphologische Eigenschaften 
phonologische Eigenschaften 


semantische Eigenschaften 
pragmatische Eigenschaften 
diskursfunktionale Eigenschaften 


Abb. 49: Konstruktion (nach Deppermann 2006a: 53) 


In dieser Abbildung steht das äußere Rechteck für die Konstruktion an sich, 
die als eine symbolische Paarung von einer Form (oberes inneres Rechteck) und 
einer Bedeutung (unteres inneres Rechteck) zu interpretieren ist. Da die Kon- 
struktion hier noch rein monomodal (verbal) definiert ist, ließe sich dieses 
Schema folgendermaßen vereinfacht darstellen: 


verbale Form 


Bedeutung 


Abb. 50: Monomodale Konstruktion 


Die monomodale Konstruktion ist also als eine Paarung von einer verbalen Form 
mit einer Bedeutung zu sehen. 
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14.1.2 Pseudo-multimodale Konstruktion 


Im Abschnitt 4.3 wurde bereits gezeigt, dass die Konstruktionsgrammatik durch- 
aus für die Integration multimodaler Größen offen steht, auch wenn in den meis- 
ten Analysen bislang nur die verbale Ausdrucksebene fokussiert wurde. Ein ers- 
ter Schritt der Integration wäre, die Gesten selber als Konstruktionen zu 
betrachten. Tatsächlich sind Gesten, genauso wie verbale Elemente, als symboli- 
sche Paarungen von einer Form mit einer Bedeutung zu sehen; der einzige Unter- 
schied besteht darin, dass die Form nicht verbal, sondern eben gestisch ist. Damit 
sind Gesten zumindest konstruktionsaffin insofern, als sie als Form-Bedeutungs- 
Paare zumindest als Konstrukte im konstruktionsgrammatischen Sinne zu inter- 
pretieren sind. Wenn dieses Paarungsmuster rekurrent ist (eine Bedingung, die 
auch bei verbalen Einheiten erfüllt sein muss, um von einer Konstruktion spre- 
chen zu können, vgl. Kapitel 4), lassen sich Gesten durchaus auch als Konstruk- 
tionen betrachten.' Infolge der hochgradigen Idiosynkrasie (u. a. Bohle 2007: 53) 
und der typischen Ad-hoc-Realisierung dürften viele Gesten also als Kandidaten 
für eine Analyse als Konstruktion ausscheiden und vielmehr als Einzelkonstrukte 
einzustufen sein. Allerdings wurde in den vorangehenden Kapiteln darauf hin- 
gewiesen, dass die in vorliegender Arbeit analysierten Gesten als rekurrent im 
Sinne von Ladewig (u. a. 2014) zu betrachten sind: Nicht nur sind sie nicht rein 
idiosynkratisch, sie weisen darüber hinaus ein gewisses Maß an Konventionali- 
sierung auf. In der Hinsicht dürfte für diese Gesten also durchaus eine Einstufung 
als Konstruktion in Frage kommen. 


1 Lanwer (2017b) merkt jedoch an, dass noch zu klären sei, ob außer multimodalen und rein 
monomodal-verbalen Konstruktionen tatsächlich auch monomodal-gestische Konstruktionen 
bestehen. Hintergrund dieser Behauptung ist wohl, dass in der bisherigen multimodalen Kon- 
struktionsforschung Gesten im Rahmen einer verbalen Äußerung fokussiert wurden - d. h. Ges- 
ten, die nicht alleine vorkommen. Allerdings bestehen solche Gesten durchaus. Kopfschütteln 
und Nicken können zum Beispiel alleine, ohne jegliche verbalen Elemente, eine befriedigende 
Antwort auf eine Entscheidungsfrage sein und sind also m. E. als monomodal-gestische Kon- 
struktionen zu betrachten. Auch die Verwendung abtönender Gesten ohne verbale Partikel käme 
für eine solche Analyse in Frage. In diesem Fall hängt die Einstufung jedoch davon ab, wie man 
den ‚Umfang‘ einer Abtönungskonstruktion bestimmt (vgl. Kapitel 4): Wenn man mit Imo (u. a. 
2007b) davon ausgeht, dass nur die Abtönungsform (in diesem Fall also die Geste) die Konstruk- 
tion ausmacht, dann sind diese Gestenbelege ohne Partikel als Argument dafür zu sehen, dass 
die Geste an sich als monomodal-gestische Konstruktion besteht. Bezieht man jedoch mit Meer 
(2012) den Skopus mit ein, so ist die Konstruktion zwar formal nur auf gestischer Ebene fixiert, 
aber die Formseite enthält ebenfalls die (nicht-spezifizierte) verbale Äußerung, die im Skopus 
der Geste liegt, und man hätte es also mit einer richtigen multimodalen Konstruktion im Sinne 
von Abschnitt 14.1.4 zu tun. 
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Das Ergebnis dieser Erweiterung des Konstruktionsbegriffs auf Gesten wird 
in Abbildung 51 gezeigt. Neben der verbalen Konstruktion (links in der Abbil- 
dung) steht jetzt auch eine gestische Konstruktion, die sich von der verbalen nur 
darin unterscheidet, dass sie statt einer verbalen eine gestische Form aufweist. 
Im Grunde genommen ist der Konstruktionsbegriff durch diese Erweiterung be- 
reits als multimodal zu betrachten, denn die Formseite der Konstruktion kann 
auch andere als nur verbale Elemente umfassen. Allerdings sind die einzelnen 
Konstruktionen an sich immer noch monomodal, denn ihre Form umfasst nur 
entweder verbale oder gestische Elemente. Die verbalen und die gestischen Kon- 
struktionen bestehen mit anderen Worten nebeneinander. Daher wird dieser 
Konstruktionsbegriff in der vorliegenden Arbeit als ‚pseudo-multimodal‘ be- 
zeichnet. 


verbale Form gestische Form 


Bedeutung Bedeutung 


Abb. 51: Pseudo-multimodale Konstruktion 


14.1.3 Semi-multimodale Konstruktion 


Diese Pseudo-Multimodalität ist ein erster Schritt bei der Aufnahme multimoda- 
ler Größen in die Konstruktionsgrammatik. Allerdings erscheint diese Situation 
wenigstens im Hinblick auf die in den vorangehenden Kapiteln beschriebenen 
Kookkurrenzmuster als suboptimal: Die verbalen und die gestischen Konstrukti- 
onen bestehen nebeneinander, ohne Verweis auf die jeweils andere Ausdrucks- 
ebene. Das ist nicht nur nicht ganz im Sinne der im Abschnitt 4.3 vorgestellten 
Idee der Integration multimodaler Größen in die Konstruktionsgrammatik, die 
davon ausgeht, dass sich Verbales und Gestisches in eine Konstruktion zusam- 
menführen lassen; zudem widerspricht es der ebenfalls in Kapitel 4 angesproche- 
nen These, dass typische Aspekte der Verwendung bzw. des Kontextes einer Kon- 
struktion selber auch Teil dieser Konstruktion sind (vgl. u. a. Fischer 2007 und 
Günthner/Imo 2006). 
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Bei einigen Kookkurrenzmustern (insbesondere bei der Kookkurrenz von 
Kopfschütteln und einfach) wurde darauf hingewiesen, dass die Kookkurrenzra- 
ten durchaus beachtlich sind, zumal die Abwesenheit der Geste in vielen Fällen 
durch externe Faktoren erklärt werden kann (vgl. Kapitel 12). In dieser Hinsicht 
ist es also als eine typische Verwendungseigenschaft der Partikel einfach zu be- 
trachten, dass mit ihr ein abtönendes Kopfschütteln einhergeht. Dementspre- 
chend sollte dies auch als Verwendungsbedingung bzw. als Kontexteigenschaft 
in die Konstruktionsbeschreibung der Partikel aufgenommen werden. 

Zu beachten ist, dass in den bisher verwendeten Schemata keine Stelle für 
diese Verwendungsbedingungen vorgesehen ist, obwohl sie als wichtiger Teil der 
Konstruktion zu betrachten sind (vgl. Abschnitt 4.1.1). Eine Erweiterung der sche- 
matischen Darstellung ist also erforderlich. In Abbildung 52 wird diese Erweite- 
rung ausgehend von der Darstellung der pseudo-multimodalen Konstruktionen 
gezeigt: Die hinzugefügten unteren Rechtecke repräsentieren die Verwendungs- 
eigenschaften der Konstruktionen, und enthalten also für die verbale Konstruk- 
tion einen Verweis auf die Gestik, für die gestische Konstruktion einen Verweis 
auf die verbale Ausdrucksebene. 


verbale Form gestische Form 
$ $ 


Bedeutung Bedeutung 


T 
H 
! 
i 


FH 
x Gestik x Verbales 


Abb. 52: Semi-multimodale Konstruktion 


Durch diese Erweiterung des Konstruktionsbegriffs sind nun die beiden Aus- 
drucksebenen (Gestik und Verbales) in jeder der Konstruktionen enthalten. In 
der Hinsicht sind diese Konstruktionen eindeutiger als multimodal einzustufen 
als die pseudo-multimodalen Konstruktionen aus dem vorigen Abschnitt. Trotz- 
dem sind auch diese Konstruktionen noch nicht als multimodal zu betrachten, 
da der Verweis auf die andere Ausdrucksebene auf den ‚Anhang‘ der Verwen- 
dungsebene beschränkt bleibt, während auf der Formebene immerhin nur eine 
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Ausdrucksebene vertreten ist. Daher wird für diesen Konstruktionsbegriff die Be- 
zeichnung ‚semi-multimodal‘ verwendet. 


14.1.4 Multimodale Konstruktion 


Auch wenn mit dem semi-multimodalen Konstruktionsbegriff bereits mehrere 
Ausdrucksebenen in einer Konstruktion vorliegen, so ist diese Situation doch 
nicht als besonders elegant einzustufen. Tatsächlich muss jeweils der Umweg 
über die Ebene der Verwendung gemacht werden, um zur anderen Ausdrucks- 
ebene zu kommen. Wenn man davon ausgeht, dass zwei Elemente einfach häufig 
gemeinsam vorkommen, ohne eine weitere Interaktion zwischen den beiden an- 
nehmen zu wollen, scheint es durchaus gerechtfertigt, sie auf der Ebene der Ver- 
wendung miteinander zu verknüpfen (dies gilt auch für Elemente, die derselben 
Ausdrucksebene angehören). Allerdings wirken bei der Vermittlung abtönender 
Bedeutungen die beiden Ausdrucksebenen (Verbales und Gestik) eng zusam- 
men. Besonders in den Fällen mit stärkerem Zusammenhang, in denen zudem 
eine klare Beziehung auf Bedeutungsebene zwischen den einzelnen Formele- 
menten vorliegt (zum Beispiel einfach+Kopfschütteln), erscheint es wertvoll, die 
beiden Ausdrucksebenen in eine Konstruktion zusammenzuführen. Tatsächlich 
sind es nicht einfach zwei Elemente, die aufgrund der Bedeutungsähnlichkeit 
häufiger gemeinsam vorkommen, sondern es liegt auch wirklich eine enge Ver- 
netzung bzw. ein enges Zusammenwirken beim Ausdruck der Abtönung vor. 
Diese Vernetzung lässt sich auf Konstruktionsebene zeigen, indem man von einer 
richtigen multimodalen Konstruktion ausgeht, deren Formseite sowohl die ver- 
bale als auch die gestische Ausdrucksebene (und ggf. auch andere nonverbale 
Ausdrucksebenen) umfasst (vgl. Abbildung 53). 
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verbale & gestische Form 


Bedeutung 


Abb. 53: Multimodale Konstruktion? 


14.2 Beispiele 


Nachdem geklärt wurde, was unter einem multimodalen Konstruktionsbegriff zu 
verstehen ist, soll jetzt auf die Frage der Beschreibung solcher multimodalen 
Konstruktionen eingegangen werden. Als Vorlage dienen dafür Imos bereits im 
Abschnitt 4.2 eingeführte Darstellungen von Modalpartikelkonstruktionen, die 
neben Form und Bedeutung auch die Ebene der Stelle im Konstruktikon bzw. des 
Bezugs zu anderen Konstruktionen umfassen (dafür aber, wie viele andere Ana- 
lysen, die Ebene der typischen Verwendungskontexte bzw. die Ebene der Ver- 
wendungsbedingungen nicht erwähnen). Ziel dieses Abschnitts ist jedoch nicht 
das Vorstellen eines Inventars aller möglichen multimodalen Konstruktionen mit 
einer der sieben untersuchten Partikeln - dafür sind noch zu viele Fragen offen, 
von denen einige im nächsten Abschnitt noch besprochen werden sollen. Viel- 
mehr geht es darum, anhand zweier Beispiele darzustellen, wie die Beschreibung 
multimodaler Konstruktionen im Falle der Modalpartikeln aussehen könnte. Als 
Beispiele werden die beiden Kookkurrenzmuster herangezogen, die auch in der 
vorangehenden Analyse die meiste Aufmerksamkeit auf sich gezogen haben: ein- 
fach+Kopfschütteln und ja+intersubjektives Deiktikum. 


2 Der Einfachheit halber und im Hinblick auf eine größere Ähnlichkeit mit dem Ausgangsdia- 
gramm in Abbildung 49 ist die Ebene der Verwendungsbedingungen in diesem Schema wieder 
ausgelassen worden. 
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[ja mit intersubjektivem Deiktikum] 


Konstruktionen 


Bezug zu anderen 
Konstruktione 


= Bezug zu anderen mögliche Interferenzen anderer Partikel-Konstruk- 


tionen (insb. Antwortpartikel) sowie mit anderen 
deiktischen Konstruktionen (insb. referentielles 
Deiktikum); 

pseudo-multimodale Konstruktionen [Modalparti- 
kel ja] und [intersubjektives Deiktikum] 


Syntax 


verbal 


Morphologie 


Prosodie 


Form 


im Mittelfeld; 

in den Satzverband integriert, aber kein selbststän- 
diges Satzglied: nicht erfragbar, nicht satzwertig; 

kombinierbar 

unflektierbar; 

nicht steigerbar 

unbetonbar 


Topologie 


gestisch 


‚Syntax‘ 


Stroke zeitgleich mit der Partikel oder der hauptbe- 
tonten Silbe; 

erstreckt sich über einen Großteil der Äußerungs- 
einheit (vgl. Skopus) 

kombinierbar mit anderen Gesten (z. B. illokutions- 
typbezogene Gesten) 


Semantik 
Funktion 


Bedeutung 


Sequentialität 


entleert 

Verweis auf Vorgegebenes, Markierung der abge- 
tönten Äußerung als nicht-initial; 

Verweis auf einen „pragmatischen Prätext“ 

Modalisierung von Äußerungen: Kodieren der Ein- 
stellung des Sprechers zur Äußerung und deren 
Kontext; 

markiert Bekanntheit einer Äußerung 

„die partikelhaltige Äußerung [erscheint] als zwei- 
ter, d.h. reaktiver Gesprächszug in einer unter- 
stellten dialogischen Sequenz“ (Diewald 1999: 
188) 
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[einfach mit abtönendem Kopfschütteln] 
© g Bezugzu anderen mögliche Interferenzen anderer Partikel-Konstruk- 
E z Konstruktionen tionen (insb. Steigerungspartikel und Adverb) 
8 g sowie mit anderen Kopfschüttelkonstruktionen 
K 5 (insb. explizit negierendes Kopfschütteln); 
25 pseudo-multimodale Konstruktionen [Modalparti- 
a“ kel einfach] und [abtönendes Kopfschütteln] 
Syntax im Mittelfeld; 
in den Satzverband integriert, aber kein selbststän- 
rn diges Satzglied: nicht erfragbar, nicht satzwertig; 
E kombinierbar 
j Morphologie unflektierbar; 
g steigerbar zu ganz einfach oder schlicht und einfach 
2 Prosodie unbetonbar 
Topologie überlappt mit der Partikel; 
S erstreckt sich über einen Großteil der Äußerungs- 
2 einheit (vgl. Skopus) 
S ‚Syntax‘ kombinierbar mit anderen Gesten (z. B. Achselzu- 
cken) 
Semantik entleert 
Funktion Verweis auf Vorgegebenes, Markierung der abge- 
tönten Äußerung als nicht-initial; 
Verweis auf einen „pragmatischen Prätext“ 
S Modalisierung von Äußerungen: Kodieren der Fin- 
= stellung des Sprechers zur Äußerung und deren 
5 Kontext; 
F markiert sprecherbezogene Evidenz einer Äuße- 
rung 
Sequentialität „die partikelhaltige Äußerung [erscheint] als zwei- 
ter, d.h. reaktiver Gesprächszug in einer unter- 
stellten dialogischen Sequenz“ (Diewald 1999: 
188) 
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Sieht man von der Hinzufügung der Ebene der gestischen Form einmal ab’, 
so sind insbesondere zwei Spezifizierungen im Vergleich zu Imos Partikelkon- 
struktionen zu erwähnen. Es handelt sich zum einen um die Interferenzen mit 
anderen Partikeln, zum anderen um die Partikelfunktion. Was die möglichen In- 
terferenzen angeht, ist zu beachten, dass durch das Auftreten der Geste einige 
Möglichkeiten ausscheiden. Insbesondere sind Interferenzen möglich mit denje- 
nigen Partikelkonstruktionen, die auch mit dieser Geste vorkommen können 
(z. B. die Antwortpartikel im Falle von ja und die Steigerungspartikel im Falle von 
einfach - auch wenn es sich bei einfach wohl nicht um eine reine Steigerungspar- 
tikel handelt), während potenzielle Interferenzen mit anderen Partikelarten eben 
durch die Anwesenheit einer abtönungsliierten Geste wohl eher unwahrschein- 
lich sind. Dafür ist aber zu beachten, dass Interferenzen mit anderen (Verwen- 
dungen der) Gesten bzw. mit anderen Gestenkonstruktionen nicht auszuschlie- 
ßen sind und dementsprechend auch hinzugefügt wurden. 

Die zweite Verfeinerung situiert sich auf der Funktionsebene und zeigt sich 
am deutlichsten am Beispiel ja. Im Abschnitt zu ja (2.3.2) wurde dargelegt, wie 
viele unterschiedliche Nuancen dieser Partikel zugeschrieben werden (Bekannt- 
heit, Wahrheit usw.). Allerdings liegt die Vermutung nahe, dass die Verwendung 
bestimmter Gesten mit ja Aufschluss über die intendierte Nuance geben kann. 
Tatsächlich lässt sich ja mit unterschiedlichen Gesten kombinieren, die nicht völ- 
lig synonym sind. So ließe sich die Hypothese aufstellen, dass das intersubjektive 
Deiktikum vor allem in solchen Kontexten eingesetzt wird, in denen die Partikel 
tatsächlich auf Bekanntes bzw. auf geteiltes Wissen hinweist. Wenn dagegen die 
Wahrheitsnuance prominenter ist, könnte man eher auf das Nicken zurückgrei- 
fen, während illokutionstypbezogene Gesten eher typische Gesten wären, wenn 
die Partikel eher als eine Art Illokutionstypmarkierer eingesetzt wird. In der Hin- 
sicht ist die Verwendung des Begriffs ‚bekannt‘ in der Konstruktionsbeschrei- 
bung auf der vorigen Seite keine Zufallswahl, sondern eine Einengung des Funk- 
tionsspektrums der Partikel aufgrund der Bedeutung der Geste. Die Hypothese 
bedarf zwar noch weiterer Verifizierung, aber es dürfte deutlich sein, dass das 
Einbeziehen der Geste auf diese Weise auch für eine Verfeinerung der Konstruk- 
tionsbeschreibung auf Bedeutungsebene sorgen kann. 


3 Da Imo bei den Partikeln die Ebene der Phonologie bzw. Orthografie auslässt, wird der Einför- 
migkeit halber auch die phonologische Beschreibung der Gesten anhand der typischen Formpa- 
rameter (Handform, Orientierung usw.) außer Betracht gelassen. 
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14.3 Diskussion 


Die im Abschnitt 14.1 befürwortete und im Abschnitt 14.2 illustrierte Integration 
der verbalen und der gestischen Ausdrucksebene in die Formseite einer einzigen 
multimodalen Konstruktion ist nicht völlig unproblematisch. Tatsächlich sind ei- 
nige Schwierigkeiten zu bewältigen, bevor man von einem solchen multimodalen 
Konstruktionsbegriff ausgehen kann. Gerade die Kookkurrenzmuster von Modal- 
partikeln und Gesten eignen sich gut, diese Schwierigkeiten zu verdeutlichen. 
Daher soll in der folgenden Diskussion immer wieder auf diese Kookkurrenzen 
hingewiesen werden, sodass die Absicht im Grunde genommen zweifach ist: Zum 
einen zeigen, dass durchaus von einem multimodalen Konstruktionsbegriff im 
Sinne von Abschnitt 14.1.4 ausgegangen werden kann, und zum anderen der 
Frage nachgehen, ob sich die besprochenen Kookkurrenzmuster von Partikeln 
und Gesten als solche multimodalen Konstruktionen analysieren lassen bzw. ob 
die im vorigen Abschnitt gelieferten Beispiele tatsächlich in dieser Form als Kon- 
struktionen betrachtet werden können. 

Im Großen und Ganzen lassen sich die Schwierigkeiten mit dem multimoda- 
len Konstruktionsbegriff in zwei Gruppen aufteilen: diejenigen, die sich auf die 
Verankerung der Konstruktion beziehen (14.3.1), und diejenigen, die mit der zeit- 
lichen Diskrepanz zwischen den einzelnen Ausdrucksebenen zusammenhängen 
(14.3.2). 


14.3.1 Verankerung der Konstruktion 


Mit ‚Verankerung‘ ist dasjenige gemeint, was gelegentlich auch mit dem engli- 
schen Begriff ‚entrenchment‘ bezeichnet wird, also inwiefern die Konstruktion 
als feste Einheit im Sprachgedächtnis der Sprachbenutzer gespeichert ist. Diese 
Verankerung hängt sehr stark mit der Frequenz der Struktur zusammen, also da- 
mit, wie oft die Struktur (in spezifischerer oder abstrakterer Form) mit einer be- 
stimmten Bedeutung verwendet wird. Gerade hier liegt jedoch eine erste Schwie- 
rigkeit, die im Grunde genommen allen weiteren in diesem Abschnitt anzu- 
sprechenden Schwierigkeiten zugrunde liegt: Auch die höchsten Kookkurrenzra- 
ten von Partikeln und Gesten liegen deutlich unter 100%. Dass Einzelfälle wie die 
im Abschnitt 9.4 angesprochene Kombination von eigentlich mit der Börsenhand 
eher auf der Ebene des Einzelkonstrukts als auf der Ebene der Konstruktion zu 
betrachten sind, erscheint durchaus verteidigbar, aber erheblich kniffliger wird 
die Angelegenheit, wenn rekurrente Kombinationen wie einfach+Kopfschütteln 
zu analysieren sind: Reichen die Kookkurrenzraten in diesen Fällen für eine Ein- 
stufung als multimodale Konstruktion aus? Diese Frage vereint in sich im Grunde 
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genommen drei Aspekte, die im Folgenden anzusprechen sind: die Frequenz der 
Kookkurrenz an sich (14.3.1.1), die Einzelverwendung der Geste wie der Partikel 
(14.3.1.2) und die Abstraktheit der Konstruktion (14.3.1.3). 


14.3.1.1 Frequenz 

Als Erstes ist bei dieser Frage hervorzuheben, dass nicht eindeutig zu bestimmen 
ist, ab welcher Frequenz von einer verankerten (‚entrenched‘) Konstruktion aus- 
gegangen werden kann. Auffälligerweise ist diese Frage auch in der traditionel- 
len, monomodal-verbal ausgerichteten konstruktionsgrammatischen Forschung 
kaum angesprochen worden, obwohl sie dafür nicht weniger relevant ist. Zum 
Teil dürfte das damit zusammenhängen, dass Verankerung bzw. Verfestigung ein 
graduelles Phänomen ist. Ähnlich haben auch Traugott/Trousdale (2013: 11) an- 
gedeutet, dass „‚sufficient frequency‘ is not operationalizable.“ Esist mitanderen 
Worten nicht möglich, zu bestimmen, ab welcher Frequenz ein Muster ausrei- 
chend rekurrent ist, um als Eigenschaft einer Konstruktion (und nicht bloß als 
Eigenschaft einzelner Konstrukte) betrachtet zu werden (vgl. auch aus multimo- 
daler Perspektive Lanwer [2017a: 3]: „in some sense, it seems to be unnecessary, 
if not impossible to define something like a frequency-threshold“). 

Außerdem ist zu berücksichtigen, dass bestimmte Faktoren die Realisierung 
der Geste bei einem verbalen Element erschweren oder unterdrücken können 
(vgl. Kapitel 12). Dies ist eine Besonderheit multimodaler Konstruktionen, denn 
bei rein verbalen Konstruktionen ist die Chance niedriger, dass ein bestimmtes 
Element der verbalen Struktur durch externe Faktoren nicht realisiert werden 
kann.“ Dementsprechend ist bei multimodalen Einheiten sowieso damit zu rech- 
nen, dass die Kookkurrenzraten deutlich unter 100% liegen. Bei welcher Höhe 
‚normale‘ Kookkurrenzraten für stärker verankerte multimodale Einheiten lie- 
gen, ist an dieser Stelle schwer zu sagen, da solche systematischen Kookkur- 
renzanalysen, wie sie für diese Konstruktionsfrage notwendig sind, bislang eher 
selten sind; um bestimmen zu können, ob die Kookkurrenzraten in vorliegender 
Arbeit vergleichsweise hoch oder gerade niedrig sind, ist eine breitere Vergleichs- 
basis notwendig.’ Zudem kann aufgrund eines solchen Vergleichs nur bestimmt 


4 Eine potenzielle Ausnahme dürften prosodische Muster darstellen. Allerdings stellt sich dabei 
die Frage, ob Prosodie als richtig verbale Ausdrucksform zu betrachten ist und nicht schon der 
Ebene der Multimodalität angehört - obwohl sie in auch in traditionellen, eher monomodal-ver- 
bal ausgerichteten konstruktionsgrammatischen Analysen gelegentlich berücksichtigt wird. 

5 Als Indiz sei erwähnt, dass Zima (2013) bei ihrer konstruktionsgrammatisch ausgerichteten 
multimodalen Analyse englischer Bewegungsverben Kookkurrenzraten zwischen 60% und 80% 
vorfindet. 
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werden, ob eine bestimmte Kookkurrenz relativ häufig oder eher selten vorliegt, 
nicht jedoch, ob sie als eine Konstruktion zu betrachten wäre. Auch für multimo- 
dale Konstruktionen ist also nicht eindeutig zu bestimmen, ab welcher Häufigkeit 
sie als verankert gelten können, aber es ist der Besonderheit Rechnung zu tragen, 
dass bei multimodalen Konstruktionen externe Faktoren die Realisierung einer 
Ausdrucksebene unterdrücken können. 

Interessant ist in dieser Hinsicht auch die Beobachtung, dass bei Wiederho- 
lungssequenzen häufig nur eine der beiden Ausdrucksebenen wiederholt wird. 
Solche Fälle erniedrigen die Kookkurrenzraten von Gesten und Partikeln, da in 
den wiederholten Instanzen jeweils nur eine der Ausdrucksebenen vertreten ist, 
sind jedoch perfekt funktional zu deuten (vgl. Kapitel 11). Auch diese Situation 
stellt eine Herausforderung für den traditionellen Verankerungsbegriff dar und 
ist typisch für multimodale Konstruktionen. Infolge der funktionalen Erklärbar- 
keit dieser Situation kann sie nicht als ein grundlegendes Problem für die An- 
nahme eines multimodalen Konstruktionsbegriffs betrachtet werden, aber bei 
der Konzeption eines multimodalen Konstruktionsbegriffs sollte ihr durchaus 
Rechnung getragen werden. 


14.3.1.2 Einzelverwendung von Geste und Partikel 

Aus der Beobachtung, dass die Kookkurrenzraten von Gesten und Partikeln deut- 
lich unter 100% liegen, geht hervor, dass sowohl die Geste als auch die Partikel 
auch einzeln verwendet werden können. In vielen Fällen lassen sich diese Ein- 
zelverwendungen durch Verweise auf bestimmte Faktoren erklären (zum Bei- 
spiel die bereits häufiger angesprochenen externen Faktoren, die eine Geste un- 
terdrücken können, sowie die Beobachtung, dass bei einer Wiederholung nicht 
unbedingt alle Facetten des multimodalen Ganzen wiederaufgenommen wer- 
den). Nichtsdestoweniger ist der Frage nachzugehen, wie sich das Vorkommen 
dieser Einzelverwendungen mit der Idee einer multimodalen Konstruktion verei- 
nen lässt - insbesondere, weil die erklärenden Faktoren nicht bei jeder Einzel- 
verwendung im Spiel sind. 

Im Grunde genommen könnte die Konstruktionsgrammatik auf mehrere Wei- 
sen mit dieser Situation umgehen. An erster Stelle ist darauf hinzuweisen, dass 
das Konstruktikon vielfach als hochgradig redundant betrachtet wird (u. a. Imo 
2007b: 26). Nicht nur wird in mehreren Zweigen der Konstruktionsgrammatik an- 
genommen, dass alle Merkmale bei jeder Konstruktion separat gespeichert wer- 
den (vgl. Deppermann 2006a): Es wird außerdem für plausibel gehalten, dass 
spezifische Realisierungen einer Konstruktion separat neben dieser Konstruktion 
gespeichert werden können, wenn sie ausreichend häufig bzw. ausreichend ver- 
festigt sind (Bücker 2012: 80). In der Hinsicht wäre es möglich, anzunehmen, dass 
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neben den pseudo- (oder semi-)multimodalen Konstruktionen [einfach] und 
[Kopfschütteln] zugleich auch die multimodale Konstruktion [Kopfschüt- 
teln+einfach] im Konstruktikon gespeichert wäre. Ein solches Nebeneinanderbe- 
stehen von Konstruktionen unterschiedlicher Spezifizität ist an sich nicht prob- 
lematisch, denn wie in Kapitel 4 bereits angedeutet wurde, ist die Schematizität 
bzw. Granularität von Konstruktionen variabel (vgl. Lanwer 2017a: 2: „differences 
between multi- and unimodal constructions can always be a matter of schemati- 
city“). 

Andererseits wurde in Kapitel 4 ebenfalls bereits darauf hingewiesen, dass 
Forscher wie Imo (2007a) und Ziem/Lasch (2011) eine Analyse von Konstruktio- 
nen als Prototypenstrukturen verteidigen. In der Hinsicht ließe sich die These for- 
mulieren, dass es einen multimodalen Prototyp mit pseudo-bzw. semi-multimo- 
dalen Varianten gäbe. In der Hinsicht wäre von einer multimodalen Konstruktion 
[Kopfschütteln+einfach] auszugehen, und die Kookkurrenzen von Kopfschütteln 
und einfach wären prototypischere, die Einzelverwendungen der Geste wie der 
Partikel dagegen weniger prototypische Instanziierungen dieser Konstruktion.® 

Außerdem wurde in der Literatur bereits darauf hingewiesen, dass manche 
verbalen Konstruktionen auf formaler Ebene trotz ihrer Verfestigung noch eine 
gewisse Variation erlauben (vgl. auch Abschnitt 14.3.1.3) oder gar fakultative ver- 
bale Elemente enthalen. So hat zum Beispiel die von Imo (2007b: 240) vorge- 
schlagene Konstruktion für finden mit Prädikativergänzung die Struktur 
[NomE + finden + (AkkE) + PrädE]’, d. h. die Akkusativergänzung ist fakultativ. 
Wenn es möglich ist, dass die verbale Ebene Optionales enthält, so stellt sich 
auch die Frage, ob nicht auch die Ausdrucksebenen bzw. die Kommunikations- 
modi an sich optional sein können. In diesem Fall gäbe es also eine multimodale 
Konstruktion mit fakultativer verbaler und gestischer Ebene (wobei wohlgemerkt 
stets eine der beiden realisiert sein muss; sonst wäre die Formseite des Kon- 
strukts leer). Im Endeffekt ist die Situation dieselbe wie bei der reinen Prototy- 
penanalyse: eine multimodale Konstruktion mit pseudo-/semi-multimodalen Va- 
rianten.® 


6 Inwiefern sich diese Analyse für diejenigen Fälle aufrechterhalten lässt, in denen die mono- 
modalen Realisierungen zahlreicher sind als die multimodalen, bleibt allerdings noch zu klären. 
7 NomE = Nominativergänzung; AkkE = Akkusativergänzung; PrädE = Prädikativergänzung. 
Die Konstruktion umfasst Strukturen wie das finde ich auch gut, bei denen in der Umgangsspra- 
che das Akkusativobjekt das, sofern seine Referenz im Kontext deutlich ist, gelegentlich ausge- 
lassen werden kann. 

8 Eine ähnliche Analyse schlägt Cienki (2017) mit seiner Utterance Construction Grammar vor: 
Die Tiefenstruktur einer Konstruktion enthält alle Ausdrucksebenen, aber an der Oberfläche 
werden nicht unbedingt alle Ausdrucksebenen auch tatsächlich jedes Mal realisiert. 
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Welche der Analysen (Redundanz oder Prototypizität) die plausiblere ist, ist 
an dieser Stelle schwer zu sagen. Zum Teil dürfte dies auch von Fall zu Fall ver- 
schieden sein. Zudem stellt sich die Frage, inwiefern sich die beiden Analysen 
überhaupt gegenseitig ausschließen. Es sollte aber deutlich sein, dass die An- 
nahme, dass neben der multimodalen auch pseudo-/semi-multimodale Varian- 
ten vorliegen, nicht ohne Weiteres impliziert, dass eine Analyse, in der von einer 
multimodalen Konstruktion ausgegangen wird, von Anfang an ausgeschlossen 
wäre. 


14.3.1.3 Abstraktheit 

Eine Frage, die weiterhin zu beantworten bleibt, ist die, wie viel Variation die 
Form- und die Bedeutungsebene einer multimodalen Konstruktion erlauben. 
Wenn eine Geste mit beachtlicher Häufigkeit mit mehreren Partikeln kookkurriert 
oder umgekehrt, ist dann von einer einzigen abstrakteren multimodalen Kon- 
struktion auszugehen oder handelt es sich doch vielmehr um mehrere verwandte 
Konstruktionen? Mit anderen Worten: Auf welcher Ebene ist die Abstraktheit der 
Konstruktion zu situieren? 

Als Beispiel kann auf die Distribution des intersubjektiven Deiktikums hin- 
gewiesen werden. Wie in Kapitel 8 dargelegt wurde, geht das intersubjektive 
Deiktikum meist mit einem verbalen Bekanntheits- bzw. Einverständnismarkie- 
rer, typischerweise der Partikel ja, einher. Allerdings ist diese Tendenz in der an- 
deren Richtung deutlich weniger stark, sodass sich die Frage stellt, ob die Struk- 
tur ausreichend verankert ist, von einer Konstruktion [intersubjektives Deikti- 
kum mit ja] nach der Beschreibung im Abschnitt 14.2 auszugehen. Andererseits 
konnte gezeigt werden, dass die meisten intersubjektiven Deiktika immerhin mit 
einem verbalen Einverständnismarkierer kombiniert werden. Dementsprechend 
dürfte durchaus von einer abstrakteren Konstruktion [intersubjektives Deiktikum 
mit Einverständnismarkierer] auszugehen sein, bei der auf der Ebene der Kon- 
struktion selber nicht spezifiziert wird, welcher Einverständnismarkierer einge- 
setzt wird (ja, doch, bekanntlich usw.). In der Hinsicht erscheint es auch möglich, 
von einer multimodalen Konstruktion auszugehen, wenn sich kein Eins-zu-eins- 
Verhältnis zwischen einer Geste und einer Partikel nachweisen lässt: Multimo- 
dale Konstruktionen können genauso wie monomodale Konstruktionen einen 
(halb)offenen Slot enthalten, der durch unterschiedliche Elemente besetzt wer- 
den kann. 

Mit dieser Beobachtung wurde jedoch noch nicht die Frage beantwortet, wie 
abstrakt die multimodalen Konstruktionen sein können bzw. wie viel Variation 
sie erlauben dürfen. Allerdings ist dies auch für monomodale (verbale) Konstruk- 
tionen nicht eindeutig festgelegt. Die Schwierigkeit des Abstraktheitsgrades stellt 
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sich mit anderen Worten nicht nur bei multimodalen Konstruktionen: Sie zeigt 
sich besonders deutlich auf dieser Ebene, gilt aber für Konstruktionen im Allge- 
meinen (monomodal wie multimodal). 


14.3.2 Zeitliche Diskrepanz 


Neben diesen Fragen der Verankerung liegt eine weitere Schwierigkeit in der Ab- 
srenzung der Konstruktion bzw. in der Bestimmung ihres Umfangs im sprachli- 
chen Diskurs. Die traditionell untersuchten monomodal-verbalen Konstruktio- 
nen sind relativ einfach abzugrenzen: Die betroffenen verbalen Elemente bilden 
die Konstruktion und grenzen sie zugleich ab; alle anderen Elemente sind nicht 
Teil der Konstruktionsform. Bei Hinzunahme der gestischen Ebene gestaltet sich 
die Abgrenzung als wesentlich schwieriger, da eine Geste und ihr lexikalisches 
Pendant nur selten (wenn überhaupt) genau denselben Anfangs- und Endpunkt 
haben. Einer der wichtigsten Gründe dafür ist, dass die Realisierung der gesti- 
schen Bewegung vielfach länger dauert als die phonetische Realisierung des le- 
xikalischen Pendants - vor allem, wenn es sich beim lexikalischen Pendant um 
ein Einzelwort handelt (vgl. Ferr& 2010), wie dies bei den Modalpartikeln der Fall 
ist. Die temporalen Unterschiede dürften in vielen dieser Fälle allerdings derma- 
ßen gering sein, dass sie für die Analyse keine größeren Probleme darstellen. 

Im Falle der in der vorliegenden Arbeit analysierten Abtönungsphänomene 
gestaltet sich die Angelegenheit allerdings als wesentlich schwieriger. Wie oben 
erwähnt, sind Modalpartikeln kurze Elemente mit weitem Skopus. Zu den meis- 
ten analysierten Gesten wurde dagegen gesagt, dass sie eine erheblich längere 
Zeitdauer aufweisen, und zwar nicht nur wegen der gerade angesprochenen län- 
geren Realisierungsdauer gestischer Bewegungen, sondern auch und vor allem 
infolge der mehrfach angesprochenen Tendenz, mit dem ganzen Skopus zu über- 
lappen. Letzteres ist im Falle der verbalen Partikeln nicht möglich, da man deren 
Äußerung nicht andauern lassen kann, während man den Rest der Äußerungs- 
einheit ausspricht. In diesem Fall liegt also eine deutliche zeitliche Diskrepanz 
zwischen der Dauer der Geste und der Dauer der Partikel vor. 

Auf den ersten Blick dürfte eine solche Diskrepanz für die Bestimmung des 
Umfangs der multimodalen Konstruktion problematisch erscheinen. Dies ist al- 
lerdings hauptsächlich darauf zurückzuführen, dass in der bisherigen konstruk- 
tionsgrammatischen Forschung die Formseite im Vordergrund gestanden hat, 
während die Bedeutungsseite weniger beobachtet wurde (Ziem/Lasch 2011: 279). 
Da es sich aber bei Konstruktionen um symbolische Paarungen von Form und Be- 
deutung handelt, stellt sich die Frage, ob nicht auch bei der Identifizierung einer 
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Konstruktion bzw. bei der Bestimmung ihres Umfangs die Bedeutung (ein- 
schließlich des Skopus) ebenso in Betracht gezogen werden sollte. Die Diskre- 
panz zwischen verbaler und gestischer Form wird damit nicht aufgehoben, was 
zugegebenermaßen als suboptimal erscheinen dürfte, aber wenigstens wird mit 
dem Skopus eine Ebene in Betracht gezogen, auf der es diese Diskrepanz nicht 
gibt. Wenn die Bedeutungsebene für den Konstruktionsbegriff genauso konstitu- 
tiv ist wie die Form, ließe sich eine solche Analyse m. E. durchaus verteidigen. 

Auch an dieser Stelle ist im Übrigen darauf hinzuweisen, dass sich die ange- 
sprochene Schwierigkeit streng genommen nicht auf multimodale Konstruktio- 
nen beschränkt. Eine interessante weiterführende Frage wäre, welche Auswir- 
kungen diese These auf monomodale bzw. pseudo-/semi-multimodale 
Konstruktionen oder Konstruktionsvarianten hätte. Tatsächlich ist auch bei einer 
Konstruktion wie [Modalpartikel einfach] eine solche zeitliche Diskrepanz nach- 
zuweisen. Allerdings handelt es sich in diesem Fall nicht um eine Diskrepanz 
zwischen den einzelnen Formebenen, sondern vielmehr um eine Diskrepanz zwi- 
schen der Form (Einzelwort) und der Bedeutung (weitem Skopus).? Hier liegt also 
eine Unklarheit im Konstruktionsbegriff, die noch weiter zu klären wäre. 


14.4 Fazit 


In diesem Kapitel wurde die Erweiterung des Konstruktionsbegriffs um multimo- 
dale Größen besprochen. Es wurde gezeigt, wie die multimodalen Ausdrucksebe- 
nen (insbesondere die in vorliegender Arbeit zentral stehende Gestik) integriert 
werden können und mit welchen Schritten der Integration zu rechnen ist, bevor 
von einer multimodalen Konstruktion im vollen Sinne ausgegangen werden 
kann. Zugleich wurde auch auf einige Hürden auf diesem Weg hin zur multimo- 
dalen Konstruktion hingewiesen. Es stellen sich zum Beispiel Fragen bezüglich 
der Häufigkeit bzw. Verankerung (‚entrenchment‘) der multimodalen Einheiten 
sowie hinsichtlich der Abgrenzung der Konstruktion im Hinblick auf die zeitliche 
Diskrepanz der unterschiedlichen formalen Ausdrucksebenen. Allerdings konnte 
gezeigt werden, dass diese Fragen keine grundlegenden Argumente gegen eine 
multimodale Erweiterung der Konstruktionsgrammatik beinhalten, zumal sie 


9 Vor diesem Hintergrund lässt sich auch der Unterschied zwischen den im Abschnitt 4.2 be- 
sprochenen Modalpartikelkonstruktionen von Imo und Meer deuten: Imo geht von einem weiten 
Skopus aus (obwohl er dies in den zitierten Beschreibungen nicht so explizit erwähnt), zählt aber 
nur die Partikel selber (explizit) zur Formseite der Konstruktion, während Meer mit ihren Struk- 
turen wie [liSkl + ja + prädErg] durchaus einen Verweis auf den Skopus in die Formseite inte- 
griert. 
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größtenteils auf Aspekte des Konstruktionsbegriffs zurückzuführen sind, die 
auch auf monomodaler Ebene noch weiterer Diskussion bedürfen. 

Zu beantworten bleibt noch die Frage, ob sich die Partikel-Geste-Kookkur- 
renzmuster als multimodale Konstruktionen betrachten lassen. Im Hinblick auf 
die gerade angesprochene Notwendigkeit einer weiterführenden Diskussion zum 
Konstruktionsbegriff im Allgemeinen ist eine endgültige Antwort schwer zu lie- 
fern. Bei nur einmal belegten Kombinationen wie eigentlich+Börsenhand, in de- 
nen zudem keine richtige Beziehung zwischen der Partikel und der Geste anzu- 
setzen ist (vgl. Abschnitt 9.4), ist dies wohl eher unwahrscheinlich; in diesen 
Fällen dürfte es sich eher um Instanziierungen bzw. um Einzelkonstrukte als um 
multimodale Konstruktionen handeln. Anders sieht es bei den rekurrenten Kom- 
binationen aus: In diesem Fall ist wenigstens von semi-multimodalen Konstruk- 
tionen auszugehen, in denen auf der Ebene der typischen Gebrauchskontexte auf 
die jeweils andere Ausdrucksebene (verbal oder gestisch) hingewiesen wird. Al- 
lerdings stellt sich diese Situation als nicht sehr elegant heraus, zumal die ver- 
bale und die gestische Ebene in einem engen Zusammenwirken gemeinsam die 
Abtönungsbedeutung vermitteln. In dieser Hinsicht sind stark rekurrente Muster 
wie [Kopfschütteln mit einfach] und [intersubjektives Deiktikum mit Einverständ- 
nismarkierer] zumindest als gute Kandidaten für eine Einstufung als multimo- 
dale Konstruktionen zu betrachten. 


15 Fazit 


15.1 Zusammenfassung 


In vorliegender Arbeit wurde auf die Frage eingegangen, ob sich Kookkurrenz- 
muster von Modalpartikeln und Gesten im gesprochenen Deutsch nachweisen 
lassen und ob es sich dabei um multimodale Konstruktionen im Sinne der Kon- 
struktionsgrammatik handelt. Fokussiert wurden drei Cluster von Modalparti- 
keln: Bekanntheits- bzw. Einverständnismarkierer wie ja und doch, Evidenzmar- 
kierer wie eben, einfach und halt, und Partikeln wie denn und eigentlich, die eine 
Frage in den Gesprächszusammenhang einbinden. Auf der Ebene der Gestik wur- 
den insbesondere diejenigen Gesten berücksichtigt, die selber auch eine abtö- 
nende Bedeutung vermitteln, aber auch weitere abtönungsliierte Gestikphäno- 
mene wurden in Betracht gezogen (abtönungsunterstützende Gesten, die selber 
keine Abtönungsbedeutung vermitteln, aber trotzdem zu Abtönungszwecken 
eingesetzt werden, und illokutionstypbezogene Gesten, die ähnlich wie Modal- 
partikeln den Illokutionstyp der abgetönten Äußerung andeuten). 

Im empirischen Teil der Arbeit wurden mehrere solche Kookkurrenzmuster 
von Partikeln und abtönenden Gesten beschrieben. Zwei davon wurden einer nä- 
heren Betrachtung unterzogen: zum einen die Kombination des abtönenden 
Kopfschüttelns mit der Partikel einfach, zum anderen die Kombination des in- 
tersubjektiven Deiktikums mit verbalen Einverständnismarkierern, insbesondere 
der Partikel ja. In den beiden Fällen ist zwischen der Partikel und der Geste eine 
deutliche Beziehung auf der Bedeutungsebene anzusetzen: Im ersteren Fall fun- 
gieren beide als Ausdruck der sprecherbezogenen Evidenz, während im letzteren 
Fall die Partikel und die Geste andeuten, dass dem Hörer unterstellt wird, dass 
ihm die Information schon bekannt sein dürfte bzw. dass zumindest erwartet 
wird, dass er nicht widerspricht. Weiterhin gehören zu den besprochenen Kook- 
kurrenzmustern u. a. die Kombination des abtönenden Nickens mit ja, die Kom- 
bination der Börsenhand und des senkrechten Ringes mit doch, und die Kombi- 
nation der Gesten ‚palm lateral‘ und ‚horizontal palm‘ mit den objektiveren 
Evidenzmarkierern eben und halt. 

Diese Kookkurrenzmuster weisen beachtliche Übereinstimmungen auf. So 
hat sich zum Beispiel herausgestellt, dass in den meisten Fällen die Geste zwar 
mit der Partikel überlappt, aber vielfach erheblich länger andauert als das Äu- 
ßern der Partikel, was als Indiz des Skopus der Abtönung interpretiert wurde. 
Außerdem wurde darauf hingewiesen, dass die abtönenden Gesten vielfach als 
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subtilere oder ‚abgeschwächte‘ Varianten anderer (nicht-abtönender) Gesten zu 
betrachten sind. Diese Beobachtung ist damit in Verbindung zu bringen, dass die 
abtönenden Gesten durch Grammatikalisierung aus anderen Gesten entstanden 
sein dürften. Diese Grammatikalisierung erklärt die formale ‚Abschwächung‘ der 
abtönenden Gesten den Quellformen (bzw. -Gesten) gegenüber sowie deren Ein- 
setzbarkeit zu Abtönungszwecken. 

Eine weitere Gemeinsamkeit zwischen den einzelnen Partikel-Geste-Kook- 
kurrenzmustern besteht darin, dass die Realisierung der Geste vielfach unter- 
bleibt. Es konnte gezeigt werden, dass tatsächlich bestimmte externe Faktoren 
die Realisierung der Geste unwahrscheinlicher machen oder gar verhindern kön- 
nen. Zu erwähnen sind u. a. Beschränkungen der Bewegungsfreiheit des Spre- 
chers (zum Beispiel, weil er etwas in den Händen hält), die körperliche Verfas- 
sung des Sprechers (u. a. der Gesundheitszustand) und Aspekte des Settings 
(u. a. die Zahl der Zuhörer und ihre Position vis-à-vis dem Sprecher), aber auch 
Kontextverschiebung und Wiederholung der Abtönung sind mit der Abwesenheit 
einer abtönenden Geste zu verknüpfen. 

Zum Schluss wurde der Frage nachgegangen, ob es sich bei den rekurrenten 
Kookkurrenzmustern um multimodale Konstruktionen im Sinne der Konstrukti- 
onsgrammatik handelt. Dazu musste zunächst geklärt werden, wie ein multimo- 
daler Konstruktionsbegriff zu konzipieren ist. Es wurden drei Grade der Integra- 
tion nonverbaler Größen in eine Konstruktion unterschieden, die als ‚pseudo- 
multimodal‘ (monomodale Konstruktionen auf unterschiedlichen Ausdrucks- 
ebenen), ‚semi-multimodal‘ (monomodale Konstruktionen mit Verweis auf an- 
dere Ausdrucksebenen auf der Verwendungsebene) und ‚multimodal‘ (die Form- 
seite der Konstruktion umfasst mehrere Ausdrucksmodi) bezeichnet wurden. 
Dabei wurde auf einige Schwierigkeiten hingewiesen, die es zu bewältigen gilt, 
wenn man die Partikel-Geste-Kookkurrenzmuster als multimodale Konstruktio- 
nen im vollen Sinn betrachten möchte, insbesondere im Hinblick auf die Häufig- 
keit der Kookkurrenz (deutlich unter 100%) und die Diskrepanz in der Zeitdauer 
zwischen der Geste und der Partikel. Allerdings konnte gezeigt werden, dass 
diese Schwierigkeiten keine grundlegenden Probleme darstellen, und dass sie 
zudem vielfach auch schon auf der Ebene der monomodalen Konstruktionen 
nachzuweisen sind, sodass es sich nicht um zwingende Argumente gegen eine 
Erweiterung des Konstruktionsbegriffs um multimodale Größen handelt. Dem- 
entsprechend lässt sich die These verteidigen, dass sich wenigstens die häufiger 
vorkommenden Partikel-Geste-Kookkurrenzmuster tatsächlich als multimodale 
Konstruktionen betrachten lassen. 
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15.2 Übersicht der Forschungsfragen 


Im einführenden Kapitel wurde eine Reihe von Forschungsfragen vorgestellt, die 
mit den unterschiedlichen Aspekten der zentralen Frage nach den Partikel-Geste- 
Kookkurrenzmustern zusammenhängen. All diese Aspekte sind im Laufe der Ar- 
beit angesprochen worden, allerdings nicht immer mit systematischen Verwei- 
sen auf die betroffene(n) Frage(n). Daher sollen die Forschungsfragen im Folgen- 
den nochmals separat aufgelistet und mit einer zusammenfassenden Antwort 
versehen werden. Da die Antwort auf die theoretischen Forschungsfragen zum 
Teil aus der Antwort auf die empirischen Forschungsfragen abzuleiten ist, soll 
mit den letzteren angefangen werden. 


15.2.1 Empirische Forschungsfragen 


(E1) Welche Rolle spielt die Gestik bei der Verwendung der hier zu erforschenden 
Modalpartikeln? Mit welchen Gestikmustern kookkurrieren sie, und in welchem 
Maße? 
Aus der Analyse ist hervorgegangen, dass alle untersuchten Partikeln (in unter- 
schiedlichem Maße) mit abtönungsliierten Gesten kombiniert werden. Wie in Ka- 
pitel 12 dargelegt wurde, geht eine stärkere bzw. präzisere Abtönungsbedeutung 
der Partikeln mit einer Zunahme der Gestenzahl einher: Bei den Evidenzmarkie- 
rern werden häufiger Gesten eingesetzt als bei den Einverständnismarkierern, 
die ihrerseits häufiger von Gesten begleitet werden als die kontext-anknüpfen- 
den Partikeln. Besonders jene Gesten, die selber eine abtönende Bedeutung ver- 
mitteln (abtönendes Nicken und Kopfschütteln, Achselzucken, intersubjektives 
Deiktikum, ‚palm lateral‘, ‚horizontal palm‘ usw.) sind bei den Partikeln mit einer 
stärkeren abtönenden Wirkung häufiger belegt, während jene Gesten, die bei den 
Partikeln mit einer weniger starken Abtönungsbedeutung eingesetzt werden, 
häufiger als abtönungsunterstützend (u. a. referentielles Deiktikum) oder illoku- 
tionstypbezogen (u. a. ‚Conduit‘-Gesten) einzustufen sind. Allerdings ist für alle 
Kookkurrenzmuster gleichermaßen darauf hinzuweisen, dass die Realisierung 
der Geste durch externe Faktoren unterdrückt werden kann, sodass mit einer be- 
achtlichen Anzahl von Partikelbelegen ohne Geste zu rechnen ist (vgl. Kapitel 12). 
Im Zentrum der Beobachtung standen in der vorangehenden Analyse jene 
Partikel-Geste-Kombinationen, bei denen die Partikel und die Geste eine sehr 
ähnliche Bedeutung vermitteln (u. a. Kopfschütteln und einfach als Markierer der 
subjektiven Evidenz, intersubjektives Deiktikum und ja als Einverständnismar- 
kierer). Allerdings konnte gezeigt werden, dass Partikeln mit einer spezifischeren 
Bedeutung auch mit Gesten mit einer allgemeineren Bedeutung (die nur einen 
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Teil der Partikelbedeutung vermitteln, u. a. die illokutionstypbezogenen Gesten) 
kombiniert werden können, und dass umgekehrt besonders bei stärker gramma- 
tikalisierten Partikeln wie ja die Partikelbedeutung gestisch spezifiziert werden 
kann, zum Beispiel durch das Kopfschütteln als Markierer der subjektiven Evi- 
denz (vgl. Kapitel 11). 


(E2) Welchen Beitrag leistet die Gestikanalyse zur Diskussion über das Verhältnis 
zwischen den Partikeln untereinander sowie zwischen den Partikeln und anderen 
verbalen Elementen der gleichen Funktionsdomäne? 

Was das Verhältnis der Partikeln untereinander angeht, wurde bei der vorigen 
Forschungsfrage bereits angedeutet, dass das Gesteninventar Aufschluss über 
die Stärke bzw. Spezifizität der Partikelbedeutung gibt. Mit den Evidenzmarkie- 
rern gehen zum Beispiel sowohl mehr abtönungsliierte Gesten im Allgemeinen 
als auch mehr abtönende Gesten im Besonderen einher als mit den Einverständ- 
nismarkierern, was damit zu verknüpfen ist, dass erstere Gruppe als eine aussa- 
gekräftigere Variante der letzteren gelten kann. Ähnlich gehen mit doch mehr 
Gesten einher als mit ja, was darauf zurückzuführen ist, dass doch neben der rei- 
nen Bekanntheits- bzw. Einverständnismarkierung, die die Funktion von ja aus- 
macht, zudem eine Adversativitätskomponente enthält (vgl. Kapitel 12). 

Von besonderem Interesse ist auch die Frage, welche Aussagen die Distribu- 
tion der Gesten über das Verhältnis der Evidenzmarkierer (eben, einfach und halt) 
untereinander erlaubt. Tatsächlich handelt es sich dabei um eine Frage, die bis- 
lang in der Literatur noch nicht einheitlich beantwortet wurde. Aufgrund der Dis- 
tribution des pragmatischen Kopfschüttelns wurde in Kapitel 6 die These aufge- 
stellt, dass ein Kontinuum einfach - halt - eben angenommen werden könnte. 
Weitere Beobachtungen in den anschließenden Kapiteln haben zwar gezeigt, 
dass dieses Bild etwas vereinfacht sein dürfte, aber die Daten legen eindeutig 
nahe, dass die Partikeln halt und eben - contra u. a. Autenrieth (2002) - nicht als 
rein synonym zu betrachten sind: Dafür sind ihre Gesteninventare zu verschie- 
den. 

Auch über die Beziehung zu anderen Elementen liefert die Gestikanalyse 
Hinweise: Wenn eine abtönende Geste, die vor allem mit bestimmten Partikeln 
zu verknüpfen ist, auch mit anderen Elementen verwendet wird, ist das durchaus 
als ein Indiz der Bedeutungsverwandtschaft zu interpretieren. Dabei handelt es 
sich um Beziehungen zwischen Modalpartikeln unterschiedlicher Cluster (zum 
Beispiel ja und schon, die beide von einem Nicken begleitet werden), aber eben- 
falls um Beziehungen zwischen typischen Modalpartikeln und Elementen, die 
herkömmlicherweise nicht als Modalpartikeln betrachtet werden, diesen aber 
von der Funktion her nahestehen (zum Beispiel ja und bekanntlich, die beide mit 
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einem intersubjektiven Deiktikum kombiniert werden können). Diese Beobach- 
tung ist im Einklang mit der Annahme, dass Modalpartikeln nicht die einzigen 
verbalen Elemente sind, die zu Abtönungszwecken eingesetzt werden können, 
und dass es sich bei der Kategorie ‚Modalpartikel‘ im Allgemeinen sowie bei den 
analysierten Partikelclustern nicht um streng abgegrenzte Kategorien handelt, 
sondern vielmehr um prototypikalische Kategorien, die gewisse Überlappungen 
mit anderen Kategorien (bzw. Partikelclustern) aufweisen. 


(E3) Inwiefern können die Gestikmuster auch ohne die verbalen Partikeln verwen- 
det werden? Inwiefern unterliegen sie dann denselben Restriktionen, und was tra- 
gen diese Beobachtungen zur Interpretation des Kookkurrenzverhaltens der Gesten 
mit den untersuchten Partikeln bei? 

Zu allen in vorliegender Arbeit besprochenen Gestikmustern wurde gesagt, dass 
sie auch ohne lexikalisches Pendant eingesetzt werden können und die Äuße- 
rung gleichermaßen abtönen. Obwohl kein systematischer Vergleich der Verwen- 
dungsbedingungen und -restriktionen vorgenommen werden konnte, konnte ge- 
zeigt werden, dass sich die Geste nicht wesentlich anders verhält, wenn keine 
verbale Partikel realisiert wird: Die Bedeutung ist nicht wesentlich anders’, die 
Dauer der Geste ist gleichermaßen ein Indiz des Skopus und die Vermutung liegt 
nahe, dass die Faktoren, die die Realisierung einer Geste unterdrücken können 
(s. Kapitel 12), ebenfalls unabhängig von der An- oder Abwesenheit einer verba- 
len Partikel wirken. 

Wichtig ist die Beobachtung, dass die Gesten mit gleicher Funktion auch 
ohne verbale Partikeln eingesetzt werden können, vor allem im Hinblick auf die 
Frage, ob es sich tatsächlich um richtige abtönende Gesten handelt: Wenn der 
Geste bei Abwesenheit der Partikel keine abtönende Wirkung zugeschrieben wer- 
den kann, ist sie vermutlich auch bei Anwesenheit der Partikel nicht als abtö- 
nend, sondern vielmehr zum Beispiel als abtönungsunterstützend zu betrachten. 

Ebenso relevant ist diese Verwendung der Gesten ohne Partikel für die Stärke 
des Kookkurrenzverhältnisses: Wenn eine Geste vor allem ohne Partikeln einge- 
setzt wird, kann nicht von einer starken Kookkurrenztendenz ausgegangen wer- 
den (das Gleiche gilt, ‚mutatis mutandis‘, auch für verbale Partikeln, die meist 
ohne Gesten eingesetzt werden). Dies hat auch Auswirkungen auf die Frage, ob 
das Kookkurrenzmuster als eine Konstruktion einzustufen sein dürfte, und wie 
das Verhältnis zwischen den Formebenen in dieser Konstruktion zu sehen ist 


1 Allerdings sind einige Sonderverwendungen nachzuweisen, die generell ohne verbale Parti- 
kel realisiert werden, zum Beispiel das Kopfschütteln bei einer Wortsuche. 
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bzw. in welchem Maße die einzelnen Ausdrucksebenen als optional zu betrach- 
ten sind. 


(E4) Welche sprachlichen wie nichtsprachlichen Faktoren beeinflussen die Distri- 
bution der relevanten Gestikmuster? 

Eine detaillierte Übersicht der Faktoren, die die Distribution der abtönungsliier- 
ten Gesten mitbestimmen, wurde im Abschnitt 12.3 geliefert. Daher werden an 
dieser Stelle nicht all diese Faktoren erneut aufgelistet, sondern lediglich dieje- 
nigen, für die tatsächlich ein signifikanter Einfluss angenommen werden konnte. 
Für die Frage, ob bei einer Partikel eine abtönungsliierte Geste realisiert wird, 
handelt es sich um Beschränkungen der Bewegungsfreiheit (Halten eines Objek- 
tes, Ausführen einer Handlung, Realisieren einer anderen Geste) sowie um die 
Haltung des Sprechers (sitzend oder stehend). Die Art der Geste (Kopf- oder 
Handgeste) wird ebenfalls von der Haltung des Sprechers beeinflusst; die Bedeu- 
tungsdimension der Geste (abtönend, abtönungsunterstützend oder illokutions- 
typbezogen) ist zudem davon abhängig, ob die verbale Abtönung, die von der 
Geste begleitet wird, kontextverschoben ist oder nicht. Darüber hinaus gibt es 
weitere Faktoren, die die Distribution der Gesten beeinflussen können, deren Sig- 
nifikanz jedoch nicht kontrolliert werden konnte. Es handelt sich u. a. um den 
Umfang des Settings sowie die Zahl der Zuhörer und deren Position vis-à-vis dem 
Sprecher. 


(E5) Inwiefern weisen isoliert auftretende Modalpartikeln andere Kookkurrenzmus- 
ter mit Gestik auf als gereihte oder kombinierte Partikeln? Lassen sich auch die Ges- 
ten reihen bzw. kombinieren, und was ist in dem Fall über das Verhalten verbaler 
Partikeln auszusagen? 
Im Hinblick auf die Gestik mit kombinierten oder wiederholten Partikeln konnten 
aufgrund der niedrigen Belegzahlen im Korpus nur vorläufige Ergebnisse erzielt 
werden. Für Partikelkombinationen konnte gezeigt werden, dass meist nur eine 
einzige Geste realisiert wird, die von der Bedeutung her mit beiden Partikeln ver- 
träglich ist, sich aber eher mit der Partikel mit der stärkeren bzw. spezifischeren 
Bedeutung verknüpfen lässt. Bei Partikelreihungen, d. h. bei wiederholter Ver- 
wendung der gleichen Partikel, geht vielfach nur mit der ersten Instanziierung 
der Partikel eine Geste einher. Wenn aber zu jeder Instanziierung der Partikel 
eine Geste realisiert wird, so bleibt diese Geste meist konstant, kann aber allmäh- 
lich abgeschwächt werden. 

Auch die Gesten können wiederholt und untereinander kombiniert werden. 
Im letzteren Fall sind zwei auf der Hand liegende Restriktionen zu beachten: Die 
einzelnen Gesten müssen von der Bedeutung her miteinander verträglich sein 
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und es muss physiologisch möglich sein, die Gesten zusammen zu realisieren. In 
vielen Fällen handelt es sich um Kombinationen einer illokutionstypbezogenen 
mit einer abtönenden Geste, aber auch abtönende Gesten untereinander können 
kombiniert werden. Was die Wiederholung abtönender Gesten betrifft, ist die Si- 
tuation nicht wesentlich anders als im Falle der Wiederholung von Modalparti- 
keln: Die Geste wird vielfach allmählich abgeschwächt, und in den meisten Fäl- 
len wird höchstens die erste Instanziierung mit einer verbalen Partikel 
kombiniert. Wenn jedoch zu jeder Instanziierung der Geste eine Partikel realisiert 
wird, so bleibt auch diese im Normalfall konstant. 


15.2.2 Theoretische Forschungsfragen 


(T1) Welche Rolle spielen multimodale Größen (insbesondere die Gestik) bei der 
Verwendung von Modalpartikeln, und welche Auswirkungen haben sie auf das tra- 
ditionelle Konzept einer Modalpartikel? 

Dass Modalpartikeln nicht die einzigen Elemente sind, die eine abtönende Wir- 
kung aufweisen können, ist schon länger bekannt (vgl. Heinrichs 1981: 66-86). 
Allerdings wurden für die Vermittlung von Abtönungsbedeutungen durch an- 
dere Elemente als Modalpartikeln bislang vor allem andere verbale Elemente und 
prosodische Muster berücksichtigt. In vorliegender Arbeit wurde jedoch gezeigt, 
dass auch nonverbale Größen durchaus zu Abtönungszwecken eingesetzt wer- 
den können. 

Fokussiert wurde insbesondere die Gestik und ihre Interaktion mit den ver- 
balen Modalpartikeln. Es wurde gezeigt, dass wenigstens zwei der Facetten der 
Bedeutung von Modalpartikeln gestisch zum Ausdruck gebracht werden können: 
die (inter)subjektive (bzw. die eigentlich abtönende) und die illokutionstypbezo- 
gene. Der konnektierenden Facette wurde weniger Aufmerksamkeit gewidmet, 
da sie für die vorliegende Analyse von geringerer Wichtigkeit war, obwohl kurz 
erwähnt wurde, dass mit dem intersubjektiven Deiktikum durchaus auf den Ge- 
sprächspartner gezeigt werden kann, um an seine Vorgängeräußerung anzu- 
knüpfen. Die illokutionstypbezogene Wirkung kann gestisch durch sogenannte 
‚Conduit‘-Gesten erreicht werden, die (inter)subjektive durch abtönende und ab- 
tönungsunterstützende Gesten. 

Insbesondere für die Verwendung der Modalpartikeln ist die Rolle dieser Ges- 
ten darin zu sehen, dass sie die Modalpartikeln begleiten und ersetzen können. 
Im ersteren Fall hat sich herausgestellt, dass besonders die Partikeln mit einer 
stärkeren bzw. spezifischeren Abtönungsbedeutung häufiger von abtönunsgsli- 
ierten Gesten begleitet werden, wobei allerdings zu berücksichtigen ist, dass nur 
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durchschnittlich 37,44% der Partikelbelege mit einer Geste kombiniert werden. 
Dennoch ist dies im Hinblick auf die in Kapitel 12 angesprochenen Faktoren, die 
die Realisierung einer Geste unterdrücken können, ein nicht zu vernachlässigen- 
der Anteil. Was die Ersetzung betrifft, sind zwei Situationen hervorzuheben: zum 
einen die Fälle, in denen die Abtönung ausschließlich gestisch vermittelt wird, 
zum anderen aber auch die Fälle, in denen bei wiederholter Abtönung nur die 
Geste, nicht jedoch die mit ihr einhergehende Partikel wiederholt wird. Diese 
Fälle zeigen, dass es möglich ist, eine Äußerung nur nonverbal abzutönen. Eine 
interessante weiterführende Frage wäre, ob unter Abwesenheit der Gesten mehr 
verbal abgetönt würde. Die Daten zeigen keine eindeutigen Tendenzen in dieser 
Richtung, denn es kann nicht bestimmt werden, ob die Sprecher, wenn sie die 
eingesetzten abtönenden Gesten nicht hätten verwenden können, an deren Stelle 
eine verbale Partikel eingesetzt hätten. Daher muss die Frage, ob die Anwesen- 
heit der Gesten für weniger verbale Abtönung sorgt, an dieser Stelle offen blei- 
ben. 

Die Auswirkungen auf das traditionelle Modalpartikelkonzept sind ebenfalls 
zweifach. Zum einen unterstreicht die Gestikanalyse die bereits in Kapitel 2 ge- 
machte Beobachtung, dass es sich bei der Kategorie ‚Modalpartikel‘ um eine pro- 
totypikalische Kategorie handelt, die nicht streng von anderen Kategorien abzu- 
grenzen ist. Dies hat auch damit zu tun, dass Modalpartikeln nicht die einzigen 
verbalen Elemente sind, die zu Abtönungszwecken eingesetzt werden können: 
Die Gestikanalyse zeigt eine gewisse Nähe der Partikeln zu bestimmten anderen 
Elementen, insbesondere bestimmten Adverbien, die auch von der Form her be- 
achtliche Ähnlichkeiten mit den Partikeln aufweisen und sich dementsprechend 
auch als unprototypische Modalpartikeln betrachten ließen. 

Andererseits ist festzuhalten, dass die abtönenden Gesten funktional das 
Gleiche leisten wie die Modalpartikeln, und mithin im Grunde genommen als ges- 
tische Modalpartikeln betrachtet werden könnten. Zudem wirken die Gesten und 
die Partikeln beim Vermitteln der Abtönungsbedeutungen eng zusammen. Da die 
Gestik als Teil der Sprache aufzufassen ist (s. Abschnitt 3.3.2), ließe sich die Frage 
stellen, ob bei solchen funktionalen Kategorien nicht neben - oder gar anstelle - 
der verbalen Kategorie ‚Modalpartikeln‘ eine multimodale Kategorie anzusetzen 
ist, die sowohl die verbalen Partikeln als auch die abtönenden Gesten und deren 
multimodale Vereinigung enthält. Dies würde ein grundsätzliches Überdenken 
des traditionellen Wortartenkonzeptes implizieren, was an sich mit dem Umden- 
ken des Sprachbegriffs von mono- auf multimodal einherginge. Damit ist nicht 
gemeint, dass der Unterschied verbal/gestisch nicht mehr zu berücksichtigen 
wäre, denn tatsächlich sind zwischen den Ausdrucksebenen Unterschiede nach- 
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zuweisen, die mit den inhärenten Eigenschaften der Ausdrucksebenen einherge- 
hen (zum Beispiel die Möglichkeit, eine Form während der Realisierung anderer 
verbaler Elemente fortzuführen, was für Gesten möglich ist, für Wörter dagegen 
nicht). Aus funktionaler Sicht aber sollte man überdenken, ob nicht statt der tra- 
ditionellen Wortarten multimodale Kategorien der Sprachbeschreibung zu- 
grunde gelegt werden sollten. Hier liegt eine Frage, die bei der weiteren Entwick- 
lung der linguistischen Forschung gewiss noch weiter überdacht werden sollte. 


(T2) Welche Stelle nehmen die für Abtönung relevanten Gestikmuster im weiten 
Feld der Gestik ein bzw. welche Arten von Gesten können zur Abtönung beitragen? 
In Kapitel 10 wurden die abtönungsliierten Gesten auf drei Dimensionen verteilt: 
die abtönenden, die abtönungsunterstützenden und die illokutionstypbezoge- 
nen. Obwohl sich alle drei Dimensionen mit Abtönung verknüpfen lassen, sind 
aus funktionaler Sicht deutliche Unterschiede nachzuweisen, die auf unter- 
schiedliche Beziehungen zu den verbalen Partikeln zurückzuführen sind. Die An- 
ordnung der Gesten, die primär mit abtönungsunterstützenden und illokutions- 
typbezogenen Funktionen zu verknüpfen sind, ist relativ einfach: Die Conduits 
sind metaphorische Gesten - auch wenn sie auf einer metasprachlichen Ebene 
anzusiedeln sind (sie liefern keine metaphorische Darstellung der in der Äuße- 
rung vermittelten Information, sondern des Vermittelns bzw. Äußerns dieser In- 
formation selber) - und die referentiellen Zeigegesten sind, wie der Name schon 
nahelest, als Deiktika einzustufen. 

Im Falle der abtönenden Gesten ist die Angelegenheit etwas schwieriger. Der 
Grund ist, dass diese Gesten unterschiedlichen Ursprungs sind: Das abtönende 
Kopfschütteln etwa hat sich aus einem Emblem entwickelt, während das in- 
tersubjektive Deiktikum eine Zeigegeste ist und die ‚horizontal palm‘-Geste aus 
einer metaphorischen Negationsgeste hervorgegangen ist, die selber auf eine iko- 
nische Repräsentation des Durchschneidens senkrechter Linien oder Stränge zu- 
rückgeht. Eine Konstante bei diesen abtönenden Gesten scheint aber zu sein, 
dass sie eine gewisse Grammatikalisierung aufweisen, die sie zu rekurrenten, 
mehr oder weniger emblematischen Gesten werden lässt, also zu konventionali- 
sierten Gestenformen mit einer konventionalisierten Bedeutung. Allerdings be- 
steht ein Unterschied zu den Emblemen im herkömmlichen Sinne in der Tatsa- 
che, dass die grammatikalisierten bzw. abtönenden Gesten für ihre Interpretation 
stärker von der verbalen Äußerung bzw. vom Kontext abhängig sind - die genaue 
Nuance des abtönenden Kopfschüttelns etwa variiert stärker als jene des emble- 
matisch-negierenden Kopfschüttelns. 

Zu diesem Zeitpunkt stellt sich die Gruppe der abtönenden Gesten infolge der 
für Grammatikalisierung typischen Persistenz noch als einigermaßen heterogen 


284 —— Fazit 


dar, was sich zum Beispiel darin zeigt, dass das intersubjektive Deiktikum noch 
eine klare deiktische Komponente aufweist, weshalb es im dritten Kapitel noch 
zu den Zeigegesten (und nicht zu den Emblemen) gezählt wurde.? Wenn in Zu- 
kunft die Grammatikalisierung weiter voranschreitet und sich die Gruppe der ab- 
tönenden Gesten weiter vereinheitlicht, dürften aber klarere Aussagen zu deren 
genauer Position im System - und insbesondere zu ihrem genauen Verhältnis zu 
den Emblemen - möglich werden. 


(T3) Welche Herausforderungen stellt die Analyse von Multimodalem für die Kon- 
struktionsgrammatik bzw. wie ist ein multimodaler Konstruktionsbegriff zu konzi- 
pieren? 

Auf die Erweiterung des Konstruktionsbegriffs um multimodale Größen wurde in 
Kapitel 14 ausführlicher eingegangen. Für eine detaillierte Antwort auf diese For- 
schungsfrage sei somit auf dieses Kapitel zurückverwiesen; an dieser Stelle sol- 
len lediglich die wichtigsten Aspekte wiederholt werden. Was die multimodale 
Natur des Konstruktionsbegriffs betrifft, wurden drei Schritte der Integration 
nonverbaler Größen unterschieden, die als ‚pseudo-multimodal‘ (monomodale 
Konstruktionen auf unterschiedlichen Ausdrucksebenen), ‚semi-multimodal‘ 
(monomodale Konstruktionen mit Verweis auf andere Ausdrucksmodi auf der 
Verwendungsebene) und ‚multimodal‘ (die unterschiedlichen Ausdrucksmodi 
sind auf der Formebene der Konstruktion vertreten) bezeichnet wurden. Bevor 
von einem solchen multimodalen Konstruktionsbegriff im vollen Sinn ausgegan- 
gen werden kann, sind jedoch einige Schwierigkeiten zu bewältigen. Diese bezie- 
hen sich insbesondere auf die Häufigkeit der Kookkurrenz von Partikel und Geste 
(in den Daten dieser Untersuchung deutlich unter 100%) sowie auf die Beobach- 
tung, dass sich die Realisierung der Partikel und der Geste zeitlich nicht perfekt 
überlappen. Allerdings konnte gezeigt werden, dass es sich nicht um grundle- 
sende Probleme handelt, zumal sie im Grunde genommen auch schon den mo- 
nomodalen Konstruktionsbegriff betreffen. Wenigstens für rekurrente Partikel- 
Geste-Kookkurrenzmuster erscheint es also gerechtfertigt, die beiden Ausdrucks- 
ebenen in die Formseite der Konstruktion zu integrieren. 


2 Allerdings sei daran erinnert, dass McNeill (2012: 10) eine gewisse Ähnlichkeit zwischen den 
Zeigegesten und den Emblemen ansetzt und sogar angibt, dass Zeigegesten auf dem Kontinuum 
der Gestendimensionen „join the emblem slot“. 
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15.3 Ausblick 


Da die vorliegende Arbeit die erste systematische Analyse der Kookkurrenzmus- 
ter von Modalpartikeln und Gesten ist, ist es nicht verwunderlich, dass noch nicht 
alle Aspekte dieser Kookkurrenz im Detail analysiert werden konnten. Dement- 
sprechend wurde im Laufe der Arbeit an mehreren Stellen darauf hingewiesen, 
dass weitere Forschung notwendig ist, um zu einem vollständigen Verständnis 
dieser Kookkurrenz zu kommen. Nicht vollständig geklärt sind u. a. die Rolle des 
Illokutionstyps bei denjenigen Partikeln, die in unterschiedlichen Illokutionsty- 
pen eingesetzt werden können, die Aspekte der Kombinatorik von sowohl den 
Partikeln als auch den Gesten und deren Auswirkungen auf die jeweils andere 
Ebene, die genaue Reichweite des Einflusses bestimmter Faktoren (u. a. des Um- 
fangs des Settings) auf die Distribution der abtönungsliierten Gesten sowie einige 
Fragen im Hinblick auf den (mono- wie multimodalen) Konstruktionsbegriff. 

Des Weiteren sei daran erinnert, dass nicht alle Partikeln und Gesten im Kor- 
pus gleich häufig belegt sind. Insbesondere die Angaben zur Partikel eigentlich 
sowie zu den meisten in Kapitel 9 besprochenen Gestikmustern (Börsenhand, 
senkrechter Ring usw.) bedürfen aus diesem Grund weiterer Verifizierung. Nicht 
nur für die Beschreibung an sich wäre eine breitere Datenbasis vorteilhaft; es 
wäre auch zu klären, inwiefern sich die allgemeineren Tendenzen (zum Beispiel 
Dauer als Indiz des Skopus) auch bei einer eingehenderen Analyse dieser selte- 
neren Partikeln bzw. Gesten aufrechterhalten lassen. 

Was den Skopus betrifft, wäre es besonders im Hinblick auf die in Kapitel 11 
angesprochenen Gestenkombinationen und die Partikel-Geste-Kombinationen 
interessant, auch die Skopusverhältnisse der einzelnen abtönenden Elemente 
weiter zu untersuchen. Bei Kombinationen verbaler Partikeln wird meistens da- 
von ausgegangen, dass die zweite Partikel im Skopus der ersten liegt (vgl. Rinas 
2007b: 428), was seinerseits damit zu verknüpfen ist, dass die Partikel mit der 
stärkeren bzw. spezifischeren Bedeutung im Allgemeinen an zweiter Stelle steht 
(u. a. Thurmair 1991b: 31). Bei Gestenkombinationen und Partikel-Geste-Kombi- 
nationen scheidet jedoch diese zeitliche Dimension als Indiz der Skopusverhält- 
nisse aus. Es wäre mithin der Frage nachzugehen, ob sich auch aus multimodaler 
Sicht die These aufrechterhalten lässt, dass die spezifischere (bzw. ‚stärkere‘) Ab- 
tönung im Skopus der weniger spezifischen liegt. Außerdem wird Thurmairs 
Skopusanalyse von Partikelkombinationen von Sonja Müller (2014) hinterfragt. 
Sie behauptet, die beiden Partikeln hätten Skopus über die partikellose Äuße- 
rung, aber es sei keine Skopusbeziehung zwischen den Partikeln selbst anzuset- 
zen. Auf diese Diskussion könnte eine eingehendere Analyse der multimodalen 
Skopusverhältnisse zweifellos ein neues Licht werfen. 
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Die noch zu erforschenden Fragen reichen jedoch weiter als nur diejenigen 
Aspekte, die im Laufe der Arbeit als Forschungsdesiderate vorgestellt wurden. 
Weiterführend ließe sich zum Beispiel noch die Frage stellen, ob abtönende Ges- 
ten intensiviert werden können. Aus der Gestikforschung ist nämlich schon be- 
kannt, dass sich Gesten intensivieren oder hervorheben lassen, indem sie zum 
Beispiel größer realisiert werden oder indem eine Geste, die sich einhändig reali- 
sieren lässt, mit beiden Händen realisiert wird (Fricke 2012: 108). In Kapitel 2 
wurde jedoch darauf hingewiesen, dass Modalpartikeln (mit Ausnahme von ein- 
fach) im Prinzip keine Intensivierung zulassen. Obwohl auch externe Faktoren 
Einfluss auf die Amplitude oder die Ein- bzw. Zweihändigkeit von Gesten haben 
können und es dementsprechend nicht immer gleich deutlich sein dürfte, wann 
eine Geste als intensiviert zu betrachten ist, erscheint es durchaus interessant, 
weiter der Frage nachzugehen, ob sich bei den Gesten im Gegensatz zu den Mo- 
dalpartikeln Intensivierungstendenzen nachweisen lassen oder ob es sich bei der 
Nichtintensivierbarkeit um eine grundlegende Eigenschaft abtönender Bedeu- 
tungen handelt, die sich sowohl verbal als auch gestisch nachweisen lässt. 

Ebenso interessant wäre eine vergleichende Studie der gestischen Abtönung 
in unterschiedlichen Sprachen. Dabei handelt es sich nicht nur um die Frage, in- 
wiefern die gleichen (oder sehr ähnliche) Gestikmuster eingesetzt werden - oben 
wurde bereits auf die sprach- bzw. kulturspezifische Natur von Gesten hingewie- 
sen -, sondern auch um die übergreifende Frage, ob bzw. inwiefern sich gesti- 
sche Abtönungsphänomene in anderen Sprachen gleichermaßen nachweisen 
lassen. Dabei wäre u. a. zu beachten, ob sich ein Zusammenhang mit der Zahl der 
Modalpartikeln in der anderen Sprache nachweisen ließe.’ In den deutschen Da- 
ten ließen sich zwar keine eindeutigen Korrelationen zwischen der Zahl der Par- 
tikeln und der Zahl der abtönenden Gesten nachweisen, aber es ist nicht auszu- 
schließen, dass sich durchaus sprachübergreifende Tendenzen aufdecken 
lassen, die besagen, dass mehr verbale Abtönung mit mehr oder gerade mit we- 
niger gestischer Abtönung einhergeht. In ähnlicher Weise wäre es interessant, 
der Frage nachzugehen, ob in Sprachen wie dem Spanischen und dem Italieni- 
schen, die im Allgemeinen als gestenreich eingestuft werden, vielleicht mehr ab- 
tönende Gesten eingesetzt werden. Müller (1998) hat zwar gezeigt, dass im Spa- 
nischen nicht mehr gestikuliert wird als im Deutschen, dass sich aber 
Unterschiede im Hinblick auf die Art der eingesetzten Gesten nachweisen lassen. 


3 Das Französische wird zum Beispiel häufig als partikelarm eingestuft. Obwohl es nicht ganz 
stimmt, dass es in dieser Sprache keine Modalpartikeln gäbe, ist die Zahl der Partikeln sowohl 
auf der Typenebene als auch auf der Tokenebene niedriger als etwa im Deutschen (vgl. Schoon- 
jans 2014b). 
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Es wäre interessant, der Frage nachzugehen, inwiefern sich eine solche Tendenz 
auch bei den abtönenden Gesten zeigt. 

Auch ein systematischerer Vergleich mit den Abtönungsphänomenen in Ge- 
bärdensprachen (insbesondere in der Deutschen Gebärdensprache, DGS) gehört 
zu den weiteren Forschungsdesideraten. Im Laufe der vorliegenden Arbeit wurde 
einige Male ansatzweise auf Übereinstimmungen mit DGS hingewiesen, aber ein 
systematischerer Vergleich steht noch aus. Es bleibt zum Beispiel noch zu klären, 
wie weit die angesprochenen Ähnlichkeiten tatsächlich reichen, sowohl im Hin- 
blick auf die verwendeten Abtönungsformen als auch im Hinblick auf Aspekte 
wie Ausdehnung als Indiz des Skopus. Ähnlich wäre den Fragen nachzugehen, 
inwiefern den Abtönungsformen in der Gestik zum gesprochenen Deutsch und in 
DGS ähnliche Grammatikalisierungsprozesse zugrunde liegen und inwiefern die 
gleichen Faktoren auf die Distribution der Abtönungsformen einwirken. 

Es dürfte also deutlich sein, dass mit vorliegender Arbeit die Erforschung der 
gestischen Abtönung im Deutschen nicht zu Ende geführt wurde. Ganz im Gegen- 
teil: Es war nur die erste Studie in dieser Domäne, die die Weichen für die Analyse 
der abtönenden Gestik im Deutschen gestellt hat und dabei einigen theoretischen 
wie empirischen Fragen auf den Grund gegangen ist, um zu einem besseren Ver- 
ständnis der Phänomene zu kommen, die aber vor allem (so hoffe ich) die Tür für 
weitere Erforschung in diesem Bereich geöffnet hat. 
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Anhang 


Übersicht der Korpusaufnahmen 


Fernsehgespräche 


Das vom Verfasser der vorliegenden Arbeit selbst zusammengestellte Korpus 
Fernsehgespräche hat eine Gesamtdauer von ca. 17 Stunden. Es umfasst im Gro- 
ßen und Ganzen zwei Arten von Daten: Zum einen handelt es sich um Talkshows 
und Fernsehdebatten, zum anderen um live übertragene Berichterstattung von 
sportlichen Veranstaltungen, insbesondere die Vor- und Nachberichte zur ei- 
gentlichen Übertragung des Events sowie Interviews mit Athleten, Trainern usw. 
Ergänzt wurden die Daten durch kurze Videoauszüge, die im Rahmen anderer 
Studien verfügbar gemacht wurden. Der Großteil der Daten entstammt Sendun- 
gen der öffentlich-rechtlichen deutschen Fernsehprogramme ARD und ZDF; die 
Auszüge FG_GOvid1/2 entstammen einer Sendung des österreichischen Fernseh- 
programms ORF. 


Sportberichte 
FG_Ala ZDF SportExtra, 25.01.2009 

Biathlon-Weltcup Antholz: Massenstart Damen 12,5km 
FG_Alb ZDF SportExtra, 25.01.2009 

Biathlon-Weltcup Antholz: Massenstart Herren 15km 
FG_Alc ZDF SportExtra, 14.02.2009 

Biathlon-Weltmeisterschaft Pyeongchang: Sprint Herren 10km 
FG_A2a ARD SportSchau, 01.02.2009 

Nordische Kombination: Weltcup Chaux-Neuve: 2. Springen 
FG_A3a ARD SportSchau, 03.02.2009 

Alpines Schifahren: Weltmeisterschaft Val d’Isere: Super-G Damen 
FG_A3b ARD SportSchau, 06.02.2009 

Alpines Schifahren: Weltmeisterschaft Val d’Isere: Superkombination 

Damen: Slalom 

FG_A3c ARD SportSchau, 08.02.2009 

Alpines Schifahren: Weltmeisterschaft Val d’Isere: Abfahrt Damen 
FG_A4a ARD SportSchau, 08.02.2009 

Skispringen: Weltcup Herren: Willingen: 1. Durchgang (Teil 1) 
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FG_A4b ARD SportSchau, 08.02.2009 

Skispringen: Weltcup Herren: Willingen: 1. Durchgang (Teil 2) 
FG_AA4c ZDF SportExtra, 14.02.2009 

Skispringen: Flugweltcup Herren: Oberstdorf: 1. Durchgang 
FG_AAd ZDF SportExtra, 14.02.2009 

Skispringen: Flugweltcup Herren: Oberstdorf: 2. Durchgang 


Talkshows 

FG_Bla Volle Kanne - Service täglich, ZDF, 29.01.2009 
FG_Bib Volle Kanne - Service täglich, ZDF, 30.01.2009 
FG_Bic Volle Kanne - Service täglich, ZDF, 02.02.2009 
FG_B2a Beckmann, ARD, 02.02.2009 


Weitere Auszüge 


FG_AFvidi Die Johannes B. Kerner Show, ZDF, 09.05.2005 
FG_AFvid2 Wetten, dass..?, ZDF, 04.11.2006 
FG_AFvid3 Wetten, dass..?, ZDF, 08.11.2003 


FG_GOvid1/2 Videoauszüge zu Gotsbachner (2008) 


FG_SCvid1/2/3 Videoauszüge zu Schmitt (2003) 


Politische Reden 


Dieser Datensatz besteht aus 21 Plenarreden im österreichischen Parlament, mit 
einer Gesamtdauer von 3 Stunden und 41 Minuten. Zusammengeführt wurden die 
Reden von Dr. Elisabeth Zima (jetzt Universität Freiburg, damals noch KU Leu- 
ven) im Rahmen ihres Dissertationsprojektes. Es handelt sich um Reden von Ab- 
geordneten unterschiedlicher Fraktionen im Rahmen von vier Nationalratssit- 
zungen aus der XXIII. Gesetzgebungsperiode (2006-2008), die zum Teil live im 
Fernsehen übertragen wurden. Nachstehende Tabelle gibt eine Übersicht der für 
die vorliegende Arbeit verwendeten Reden aus Zimas Korpus. 
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Tab. 18: Übersicht der politischen Reden 
(live übertragen wurden die Reden am 30.10.2006 sowie am 08.11.2007) 


Abgeordneter 30.10.2006 29.11.2006 25.04.2007 08.11.2007 
Josef Cap v v v v 
Wilhelm Molterer v 

Wolfgang Schüssel v v v v 
Heinz-Christian Strache v v v v 
Alexander Van der Bellen v v v v 
Peter Westenthaler v v v v 
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Transkriptions- und Annotationskonventionen 


Transkription gesprochener Sprache 


Beim Verfassen der Transkriptauszüge in vorliegender Arbeit wurde eine leicht 
erweiterte Basisversion der GAT2-Konventionen angewandt (vgl. Abschnitt 5.2). 
Nachstehende Übersicht enthält die in der Arbeit verwendeten Transkriptionszei- 
chen. Eine ausführlichere Darstellung der Konventionen findet sich bei Selting 
et al. (2009). 


akzEnt Sekundärakzent 

akZENT Primärakzent' 

ak!zENT! Extra starker (meist emphatischer) Akzent 
z) Mikropause (Dauer bis ca. 0.2 Sek.) 
-) Kurze Pause (Dauer ca. 0.2-0.5 Sek.) 


---) Längere Pause (Dauer ca. 0.8-1.0 Sek.) 
1.3) Pause von mehr als ca. 1 Sekunde (die Zahl gibt die gemessene 
Zeitdauer in Sekunden an) 


( 
( 
(--) Mittlere Pause (Dauer ca. 0.5-0.8 Sek.) 
( 
( 


? Tonhöhe steigt am Ende der Intonationseinheit hoch an 
A Tonhöhe steigt am Ende der Intonationseinheit leicht an 
- Tonhöhe bleibt am Ende der Intonationseinheit gleich 

A Tonhöhe fällt am Ende der Intonationseinheit leicht ab 


Tonhöhe fällt am Ende der Intonationseinheit stark ab? 


1 Tonhöhensprung nach oben 
\ Tonhöhensprung nach unten 


1 Wenn die Silbe, die den Primärakzent trägt, nur aus Vokalen besteht (was zum Beispiel am 
Wortanfang möglich ist) und die Akzentmarkierung infolgedessen nicht von einem Sekundärak- 
zent zu unterscheiden wäre, so wird auch der erstfolgende Konsonant großgeschrieben, um zu 
markieren, dass es sich um einen Primärakzent handelt (wenn lediglich der Vokal groß geschrie- 
ben wird, handelt es sich also der Regel nach um einen Sekundärakzent). 

2 Im Grunde genommen lässt die GAT2-Konvention offen, wie das Ende abgebrochener Intona- 
tionseinheiten anzudeuten ist. In vorliegender Arbeit erhalten diese keine Markierung des Ton- 
höhenverlaufs. 
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°h Einatmen? 
h° Ausatmen 

[ ] Überlappungen & Simultansprechen (wenigstens der 
[ ] Anfang der Überlappung wird angedeutet) 

= Schneller Anschluss 

Dehnung‘ 

<<p> > Leise gesprochen (p = piano) 

<<pp> > Sehr leise gesprochen (pp = pianissimo) 

( ) Unverständliche Passage 

(da) Vermuteter Wortlaut 

> Verweis auf die im Text angesprochene Einheit 


Markierung der Gestik 


Die GAT2-Konventionen sind auf rein verbale Transkriptionen ausgerichtet und 
sehen deshalb keine Zeichen zur Andeutung von Gestik vor. Da in vorliegender 
Arbeit die transkribierten Beispiele jeweils ein bestimmtes, im Text besprochenes 
Gestikmuster illustrieren sollen, ist es nicht notwendig, in die Transkripte selber 
Angaben zur Art der Geste aufzunehmen. Wichtig ist allerdings die Markierung 
der Dauer der Geste bzw. der Stelle in der verbalen Äußerung, an der die Geste 
realisiert wird. Dies wird wie folgt gemacht: 


{ } Dauer der Geste (bzw. Worte, mit denen die Geste zeitgleich re- 
alisiert wird) 
‚Stroke‘ und ggf. ‚Stroke Hold‘ der Geste (bzw. Worte, die mit 
dem ‚Stroke‘ und ‚Stroke Hold‘ überlappen) 


3 Im Gegensatz zur eigentlichen GAT2-Konvention wird in der vorliegenden Arbeit die Dauer 
des Ein- bzw. Ausatmens nicht markiert. 
4 Auch bei Dehnungen wird in der vorliegenden Arbeit keine Dauer angegeben. 
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Analyse der Gestik 


Wie in Kapitel 6 dargelegt wurde, werden in vorliegender Arbeit zur Analyse der 
Gestik Parameter unterschiedlicher Annotationssysteme herangezogen. Im Fol- 
genden wird nochmals eine Übersicht der relevanten Parameter geliefert. 


Hand- und Armgesten 


Form 

- Händigkeit: linke Hand 
rechte Hand 
beide Hände 


- Basisformen: flache Hand 
Schüsselhand 
Fingerzeigen 
Spitzhand 
Ringhand 


Abb. 54b: Spitzhand und Ringhand (Zeichnungen nach Kendon 1995: 250, 268) 


Orientierung 

- Handfläche: dem Körper zugewandt 
vom Körper abgewandt 
dem Mittelpunkt des Gestenraums zugewandt 
vom Mittelpunkt des Gestenraums abgewandt 
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nach oben gewandt 

nach unten gewandt 

diagonal 

(= Richtung einer imaginären Linie lotrecht auf der Handfläche) 


- Finger: vgl. Handfläche 
(= Richtung, in der die Fingerspitzen zeigen) 


Bewegung 

- Typ: gerade 
bogenförmig 
kreisförmig 
zickzack 
schlängelnd 
spiralförmig 


- Richtung: nach links/rechts 
nach vorne/hinten 
nach oben/unten 
diagonal (Kombination der Dimensionen) 


- Charakter: groß/klein 
schnell/langsam, kurz/lang 
fließend/stockend 
usw. 
(nur wenn als auffällig oder markiert perzipiert) 


-Anzahl: einfach 
wiederholt 
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Position 
- Höhe & Radiusorientierung: vgl. McNeill (1992, 2005): 


EXTREME 
PERIPHERY 


gh CENTER- 


CENTER 


Abb. 55: Zonen im Gestenraum nach McNeill (1992: 89) 


- Tiefe: auf Armlänge (‚far‘) 
auf Ellenbogenlänge (‚normal‘) 
nah (‚close‘) 
am Körper (‚touch‘) 
hinter dem Körper 


Abb. 56: Die Tiefendimension nach Kipp/Neff/Albrecht (2007: 332) 
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Kopfgesten 


Orientierung 
-Hebung: gehoben 


neutral 
gesenkt 


- Neigung: nach links geneigt 
aufrecht 
nach rechts geneigt 


- Drehung: nach links gedreht 
nach vorne 
nach rechts gedreht 


Bewegung 

- Typ: gerade 
bogenförmig 
usw. 


- Richtung: nach links/rechts 
nach vorne/hinten 
nach oben/unten 


- Charakter: groß/klein 
schnell/langsam, kurz/lang 
fließend /stockend 
usw. 
(nur wenn als auffällig oder markiert perzipiert) 


- Anzahl: einfach 
wiederholt 
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